提交新活动

谢谢!您的提交已收到!
糟糕!提交表单时发生错误。

提交新闻报道

谢谢!您的提交已收到!
糟糕!提交表单时发生错误。

订阅新闻通讯

谢谢!您的提交已收到!
糟糕!提交表单时发生错误。
2021年10月20日

CZI EOSS 更新

作者

Dask去年获得了CZI Essential Open Source Software资助计划第二轮的资金。这笔资金用于聘请Genevieve Buckley从事Dask的工作,重点是生命科学。上个月,Dask向CZI提交了一份中期进展报告,涵盖2021年2月至9月期间的工作。该进展更新全文发布如下,以与更广泛的Dask社区分享。

进展概述

简要摘要

Dask研究员的工作范围包括代码贡献、会议演讲和教程、社区参与以及包括博客文章在内的推广活动。

 本提案的主要交付成果是与相邻软件项目的一致性和成功。

项目迄今为止的工作包括

     
  • 在5个不同的存储库中合并了38个拉取请求(另有6个草稿拉取请求)。
  •  
  • 3次会议(演讲和专业研讨会组织)
  •  
  • 1个半天研讨会(另有1个即将举行)
  •  
  • 监督Dask的Google编程之夏项目学生
  •  
  • 9篇博客文章(另有2篇即将发表的草稿)

代码贡献

代码贡献不仅限于主Dask存储库,还包括使用Dask的相邻软件项目(例如napari软件项目),包括:daskdask-imagedask-examplesnapari & napari.github.io

迄今为止,Dask研究员在上述五个存储库中贡献了

     
  • 38个拉取请求
  •  
  • 6个草稿拉取请求
  •  
  • 12个已关闭的拉取请求(未合并,被另一种方法取代)

Dask研究员是dask-image项目的官方维护者,该项目实现的其他里程碑包括

     
  • 维护者团队增加了一名成员(我们欢迎Marvin Albert加入)
  •  
  • 2020年发布了2个新的dask-image版本

代码贡献亮点

亮点包括

使更广泛社区受益的Bug修复

  • dask PR #7391:这个PR修复了Dask的bincount函数输出的切片问题。这个修复的影响很大,因为它解决了在四个独立项目中提交的问题:scikit-imagedask-mlxgcm/xhistogram以及cupy dask测试。      
  •  

扩展的GPU支持

  • dask PR #6680:这个PR为*_like数组创建函数中不同数组类型提供了支持。现在用户可以创建类似cupy的Dask数组用于GPU处理,或者任何其他数组类型(例如:sparse)。
  • dask-image PR #157:这个PR为dask-image项目中的二值形态学函数提供了GPU支持。
  •  

惠及所有Dask用户的可视化工具

  • dask PR #7716:这个PR会自动在jupyter notebook单元格输出中显示高级图可视化(低级图已经自动实现了)。      
  • dask PR #7763:这个PR为Dask的HighLevelGraph对象引入了HTML表示形式。这使得用户和开发者能够更轻松地检查HighLevelGraphs的结构和状态。
  • 在Dask Google编程之夏项目期间进一步开发,完整报告请参见此处
  •  

高级图

  • dask PR #7595:这个PR为数组重叠引入了高级图层。高级图是我们可以用来优化Dask性能的工具。      
  • dask PR #7655 (进行中):这个PR为Dask数组切片操作引入了高级图。
  •  

内存改进 (进行中)

  • dask PR #8124 (进行中):这个PR研究了针对由重塑Dask数组引起的内存问题的改进自动分块策略。      
  • dask PR #7950 (进行中):这个PR旨在通过自动分块Dask数组来改进tensordot函数的内存使用和性能。
  • dask PR #7980 (进行中):这个PR旨在修复tensordot中无限内存使用的问题,该问题报告于此处

会议

2021年重要的会议活动包括SciPy会议、Dask峰会和VIS2021。

SciPy 会议

Dask研究员在2021年SciPy会议上发表了题为“Scaling Science: leveraging Dask for life sciences”的演讲。完整记录可在此处查看

Dask 峰会

Dask研究员在2021年Dask峰会上组织了两次研讨会

     
  1. Dask Down Under (与Nick Mortimer共同组织),以及
  2.  
  3. Dask生命科学研讨会
Dask Down Under

Dask Down Under 的范围更像是一个针对澳大利亚时区的小型会议,而不是典型的研讨会。Dask Down Under 包括为期两天的活动,涵盖

     
  • 5场演讲
  •  
  • 2个教程
  •  
  • 1场小组讨论
  •  
  • 1场见面交流活动

它受到了社区的热烈欢迎。关于Dask Down Under活动的完整报告请参见此处。Dask Down Under活动的YouTube播放列表可在Dask YouTube频道此处查看。

Dask生命科学研讨会

Dask生命科学研讨会包括

     
  • 15场预先录制的闪电演讲
  •  
  • 3次互动讨论时间(覆盖欧洲、大洋洲和美洲时区)
  •  
  • Dask峰会期间的全程异步文字聊天

关于Dask生命科学研讨会的完整报告请参见此处。所有Dask生命科学闪电演讲的YouTube播放列表可在Dask YouTube频道此处查看。

VIS2021 研讨会

Dask研究员受邀参加了2021年2月的VIS2021研讨会,担任小组讨论成员。“问题解决者”小组讨论涵盖了图像分析中的实际问题以及Dask和napari等工具如何帮助解决这些问题。

教程和研讨会

Dask研究员与Juan Nunez-Iglesias在2021年澳大利亚光学显微镜会议上共同主持了一个半天(五小时)的研讨会。napari是一个开源多维图像查看器,使用Dask构建用于核外图像处理。研讨会内容可在此链接查看:https://github.com/jni/lma-2021-bioimage-analysis-python/

即将举行的研讨会:Dask研究员受邀在即将举行的NEUBIAS Academy上,就使用Dask处理napari和大数据的问题进行研讨会。研讨会内容可在此链接查看:https://github.com/GenevieveBuckley/napari-big-data-training

Google编程之夏

Dask研究员在2021年指导了一名Google编程之夏学生。Martin Durant担任了副指导老师。该项目持续了3个月,涉及实现多项功能以改进Dask图和对象的可视化。关于Dask GSOC项目的完整报告请参见此处

博客文章

我们设定了每月一篇博客文章的目标,并超额完成。迄今为止,Dask研究员已发表九篇博客文章,另有两篇目前处于草稿状态。

     
  1. 了解生命科学社区
  2.  
  3. 使用PyTorch和Dask进行大规模图像分析 (与Nick Sofreniew合著)
  4.  
  5. 骨架分析
  6.  
  7. 2021年Dask峰会上的生命科学
  8.  
  9. 2021年Dask用户调查现已发布
  10.  
  11. Dask Down Under (与Nick Mortimer合著)
  12.  
  13. 不规则输出,如何处理形状尴尬的结果
  14.  
  15. 高级图更新
  16.  
  17. Google编程之夏 2021 - Dask项目

草稿状态,即将发布