Dask生命科学研讨会是2021年Dask峰会的一部分。本次研讨会的闪电演讲可在此处获取,您可以继续阅读了解活动摘要。
Dask生命科学研讨会作为2021年Dask峰会的一部分举行。目前许多生命科学领域的人在使用Dask,但各个小组相对独立。本次研讨会为我们提供了一个相互学习的机会,也提供了找出常见问题和改进领域的机会。
本次研讨会包括
如果您错过了Dask峰会,可以在YouTube上补看。此处提供所有生命科学闪电演讲的播放列表可在此处获取。
您也可以加入我们在Slack上的#life-science频道:点击此处获取邀请链接。
我们邀请了生命科学研讨会的与会者进行简短的问答,讨论他们使用Dask的工作。这只是参与者的一小部分,许多人参加了会议但没有进行问答。
这些回复概述了社区中人们正在进行的各种工作。以下是一些问答,排名不分先后。
姓名: Tom White
时区: 欧盟/英国
您从事什么类型的科学研究? 统计遗传学
您曾用Dask尝试过(或想尝试)什么? 大规模运行逐行线性回归。
您接下来想用Dask做什么? 协同优化公共工作流(GWAS)。
闪电演讲: 点击此处
姓名: Giovanni Palla
机构: 慕尼黑亥姆霍兹中心
时区: 欧洲
您从事什么类型的科学研究? 计算生物学和空间转录组学
您曾用Dask尝试过(或想尝试)什么? 使用dask-image进行图像处理。
**您接下来想用Dask做什么?** 与Squidpy进一步集成。
**闪电演讲:** 点击此处
姓名: Isaac Virshup
机构: 墨尔本大学。开源项目Scanpy和AnnData时区: AEST
您从事什么类型的科学研究? 单细胞组学数据。
您曾用Dask尝试过(或想尝试)什么?
我曾用Dask进行了一些嵌套的“极其并行”计算。拥有一个智能调度器和良好的监控功能使得这项任务变得非常简单,特别是与multiprocessing或joblib相比。
您接下来想用Dask做什么?
我很想将AnnData(一个用于处理单细胞检测数据的容器)与dask集成。该领域的数据集大小不断增加,无论可用内存多少,都能处理最新、最棒的数据集将是一件好事。
由于我们严重依赖稀疏数组,实现这一目标的关键一步将是让dask内部更好地支持稀疏数组(特别是CSC和CSR)。毕竟,如果我们的扩展策略需要数倍的总内存,那就不太理想了!作为维护者,我很乐意听取人们关于与dask良好集成的分布式工具的经验。
闪电演讲: 点击此处
姓名: Anna Kreshuk
机构: 欧洲分子生物学实验室
时区: CEST (GMT+2)
您从事什么类型的科学研究? 用于显微镜图像分析的机器学习。
您曾用Dask尝试过(或想尝试)什么? 我们运行了许多图像处理工作流,想看看在这种情况下如何利用Dask。
姓名: Beth Cimini
机构: Broad研究所
时区: 美国东部
您从事什么类型的科学研究? 用于显微镜成像的用户友好型图像分析工具。
您曾用Dask尝试过(或想尝试)什么? 让Dask在CellProfiler中工作,以便轻松地对大型图像进行高通量分析!
闪电演讲: 点击此处
姓名: Volker Hilsenstein
机构: EMBL / Alexandrov实验室
时区: 中欧夏令时
您从事什么类型的科学研究? 空间代谢组学,结合显微镜和质谱。
我想用dask尝试什么: 融合大型图像或图像卷的镶嵌图,这些图像或图像卷可进行仿射变换到统一坐标系。
姓名: Marvin Albert
机构: 苏黎世大学
时区: UTC/GMT +2
您从事什么类型的科学研究? 生命科学/图像分析
您曾用Dask尝试过(或想尝试)什么?您接下来想用Dask做什么? 并行化/减少图像处理任务的内存占用,并定义可在不同计算环境中运行的工作流。
闪电演讲: 点击此处
姓名: Jordao Bragantini
机构: CZ Biohub
时区: 太平洋夏令时 (UTC -7)
您从事什么类型的科学研究? 光片显微镜
您曾用Dask尝试过(或想尝试)什么? 极大数据集的图像处理。
您接下来想用Dask做什么? 实现细胞分割算法。
闪电演讲: 点击此处
姓名: Josh Moore
机构: 开放显微镜环境 (OME)
时区: CEST
您从事什么类型的科学研究? 生物成像(RDM基础设施)
您曾用Dask尝试过(或想尝试)什么? 主要通过HTTP访问大型图像(Zarr)卷。您接下来想用Dask做什么? 改善典型使用模式的预取,可能集成多尺度数据(例如谷歌地图缩放)。
闪电演讲: 点击此处
姓名: Jackson Maxfield Brown
时区: PST
您从事什么类型的科学研究? 细胞生物学,特别是显微镜学和计算生物学。
您曾用Dask尝试过(或想尝试)什么? 构建了一个支持元数据/基于元数据的显微镜成像读取库,它使用Dask根据元数据维度信息按块读取任意大小的图像。还使用Dask + Prefect构建了TB级图像处理管线。
您接下来想用Dask做什么? 与其他库更紧密地集成。我看到了RAPIDs团队的cuCim,并希望与他们合作,创建一个更通用的“生物图像规范”,以便我们都能良好协作。
闪电演讲: 点击此处
姓名: Gregory R. Lee
机构: Quansight
时区: EST (UTC-5)
您从事什么类型的科学研究? 科学软件开发(背景为磁共振成像研究)。
您曾用Dask尝试过(或想尝试)什么?
在过去的研究工作中,我主要在两种场景下使用Dask,都在单个工作站上进行
您接下来想用Dask做什么?
审计scikit-image函数,确定哪些可以轻松地使用dask-image中的分块方法进行加速。理想情况下,一部分函数可以直接接受dask数组作为输入,而不是要求用户学习Dask的map_overlap等才能使用此功能。
闪电演讲: 点击此处
Dask目前正在考虑为生命科学社区举办“办公时间”(答疑时间)。如果我们能找到足够多的维护者主持一小时的问答环节,我们将试行一段时间。