我的基因组演变以及实用科技进步之旅

RATE THIS STORY:
Rating Unavailable Rating Unavailable Rating Unavailable Rating Unavailable Rating Unavailable
VOTES SO FAR

您记得 1975 年夏天发生了什么?

赛车迷?您可能还记得 Bobby Unser 在印第安纳波利斯 500 英里大奖赛夺冠。(由于是雨天,比赛有点短。)对太空探索感兴趣?您可能还记得联盟号飞船 (Soyuz 19) 和阿波罗登月,或者维京 1 号探测器 (Viking 1) 发射升空。

您可能还记得美国各加油站前长长的队伍、一部关于巨鲨的著名电影上映,或者风行一时的心情戒指和宠物石。我也记得多数这些发生过的事。

但我记得最清楚的是我被确诊 1 型(胰岛素依赖型)糖尿病。我那时还只是个孩子。那次诊断是否改变了我的生活?是的,但那时我的体会不深。当时我也不能理解我的父母为什么在从医生办公室开车回家的路上既焦虑又沉默。

由于当时科研进展缓慢,1 型糖尿病的治疗只有少数选项

那时,我哥哥在 5 年前就已被诊断患有糖尿病,所以我略微知道如何管控 1 型糖尿病。他的管控方法(也会成为我的管控方法)包括用试剂条测量血糖和酮体,遵循严密固定、严格规范的饮食,以及定期给自己注射动物源胰岛素。那时我们依赖于试剂条,因为血糖监测仪通常在医生办公室才会有,当时还不是很普及。这些都是标准的疗法,千篇一律。这在当时是最好的疗法。

1975 年后的几年间,1 型糖尿病的管控变得容易了一些。除了有动物源胰岛素,医生也可以选择人胰岛素和人工合成胰岛素。我们不再依靠血糖/酮体测量试剂条,转而采用直接的、几乎即时的血糖监测。那时我有了第一台家用血糖监测仪。那是个鞋盒大小的奇特装置,要经过好几个步骤才能获得比较准确的测量数据。但它毕竟是可以起作用的,我们可以立即测量血糖,并采取措施帮助控制血糖。

1 型糖尿病的治疗现在包括嵌入式持续监控、手机应用程序和泵

如果在 1975 年提到今天这些血糖管控方法的发展水平,我根本就听不懂你在说什么(我猜很多医生也一样)。用手机随时随地对血糖进行持续监控?是的,我们已经实现了。用便携式可穿戴设备,在医生指定的时间点以及在需要时自动注射胰岛素?是的,我们也已经实现了。

尽管目前的 1 型糖尿病治疗令人惊叹,但这并不能解决问题的根源。人们为什么会患上糖尿病?

已经有很多人患上 1 型糖尿病,而且还会越来越多

Beyond Type 1统计,全美共有 125 万 1 型糖尿病患者,此外每年还会新增 4 万名确诊患者。而这还仅仅是在美国!为什么会这样?为什么每年都会有这么多人确诊患有糖尿病?对于已经确诊的患者,我们如何才能更好地管控病情?

我们稍后再来谈这些问题。让我们先来看一个可能的发展方向:精准医疗。

什么是精准医疗?

精准医疗——把患者个人与快速的靶向疗法相匹配——可能会提供一部分答案。

在“2018 美光洞察”大会上,美光执行副总裁兼首席业务官SumitSadana描述许多医疗挑战是大数据问题。他说,当您谈到真正棘手的挑战时,比如人类健康、人类基因组等等,您在谈论的其实是十亿字节的数据。他还提到(由于需要分析海量规模的数据),解决这些问题需要人工智能和机器学习。

美光 QLC SSD 是朝着正确方向迈出的一步

在美光,我们的愿景是改变世界使用信息的方式,从而丰富人们的生活。我们对于内存和存储技术创新的专注能够改变研究方式的基石。其中一个例子是四层单元 (QLC) NAND 以及对以读取为中心的研究型工作负载的好处。

我们希望以合理的价格提供日益增长、以读取为中心的工作负载,因此我们设计了美光 5210 ION SSD,以满足人们对高性价比、高性能储存器日益增长的需求。我们在业内率先推出了搭载 QLC NAND 的固态硬盘——美光 5210。QLC NAND 是下一代存储技术,以经济的价格提供更快的能力。该产品专门针对读取密集型、性能敏感型工作负载(例如含有未结构化信息的数据湖)进行了优化,这些负载可为机器学习和人工智能算法提供数据。

美光推出 5210 之前,这些读取密集型工作负载受限于 50 年前诞生的硬盘技术的迟缓性能。

专家团队努力从海量数据集学习基本知识

为了解QLC 5210 ION如何改进具有海量数据集的研究工作负载,我们携手 Colfax International 的研究团队进行了一个机器学习的项目。Colfax Research 总部位于硅谷,帮助人们利用新平台在计算创新领域创造价值。

Colfax Research 分析了美光 5210 SSD 在处理海量人工智能和机器学习数据方面如何比原(传统)机器学习存储器 (7200 RPM HDD) 更为出色。然后发布了一份标题为“新型 QLC SATA SSD 如何实现更快的机器学习”的白皮书。Colfax Research 采用一个 7.68TB 5210 ION SSD 和一个 7200 RPM HDD 对TFRecord的处理量和完成时间进行了分析,然后得出结论:

“在我们的研究中,就生成 TFRecord 文件而言,美光 5210 ION SSD 实现了图像数据集的读取密集型变革,比类似大小 HDD 的速度高 8 倍。在 100,000 个图像数据集(每张图像 23 MB)中,我们的测试 HDD 用了 15.17 个小时调整图像大小,然后打包成单个 TFRecord 文件,而美光 5210 ION SSD 只用了 1.88 小时完成同样的任务,比 HDD 节省了 13 个小时。”

Colfax Research 的测试结果如下所示:

Rollins SSD

在本例中,高清图像(Colfax Research 测试了多达 100,000 个图像)必须经过尺寸调整并加入 TFRecord 中,然后才能开始分析。在加速处理数据并更快速从数据获得重要洞察方面,美光 5210 ION SSD 有何优异之处?

在讨论美光 5210 SSD 的益处时,Colfax Research 分享了其对 QLC SSD 价值的看法:

“多年以来,7200 RPM 硬盘 (HDD) 一直是存储机器学习(ML)训练数据集的标准介质。这些传统的 HDD 因低成本和易于使用的 SATA 接口而一直获得青睐。然而,HDD 受限于相对慢的处理能力。一直以来,固态硬盘 (SSD) 都因太过昂贵而无法显现优势。尽管 SSD 成本 / GB 不断下降,其总体成本仍然是大多数 ML 平台无法承受的,只有一些严苛(昂贵)的 ML 平台才能负担。随着 QLC SSD—— 美光® 5210 ION 企业级 SATA SSD 的问世,这一障碍被打破。”

公司继续阐述:

“更快的完成时间对整体项目的价值、交付和成本产生巨大影响。当分析美光 5210 ION 的潜在益处时,只看购置时的每 GB 成本是短视的。应该考虑的是总拥有成本,保持昂贵的 CPU 资产繁忙运转的价值,以及与电源和散热相关的年度运营费用的潜在减少。”

美光内存加速医疗 AI

医疗人工智能领域的算法不断优化,让我备受鼓舞。凭借我们快速而巨大的存储技术,美光内存在提高计算机硬件能力方面发挥着关键的作用。然而,人工智能的深度神经网络会对数据中心构成压力。在数据处理过程中,需要使用快速内存来实现高效计算。作为我们的解决方案之一,美光 64GB 3200 MT/s RDIMM在相同配置的基础上采用双倍密度,因其迭代特性而在训练神经网络时显现极高价值。

我在美光贡献绵薄之力

我很自豪地告诉人们我在美光工作。在展会、技术会议或家长会上,我自豪地告诉他人我在美光的存储业务部门工作。我承认,我有点自满。

不止是因为美光制造很酷的东西(我们确实是!),还因为我们助力精准医疗的发展。美光正在从根本上改变着研究者和科学家推动医疗诊断与治疗的方式,而这其中可能就会产生(最终)根治 1 型糖尿病的途径。

借助于海量基因组数据,早期诊断和更好的疾病管控正在解决精准医疗的难题

我是全美 125 万 1 型糖尿病患者中的一员。每年,美国新增 4 万名患者。回顾我的糖尿病历程,我看到了一些惊人的变化。我见证了疗法从动物源药物变成人药物,再变成穿戴式自动给药设备。我们看到了监测方法从试剂条到家用血糖监测,到便携式监测仪,再到如今的可通过手机读取的植入式实时传感器。

我还会看到什么?随着对人类基因组研究和理解的快速发展,我迫不及待地想要找出答案。更早期、更准确的诊断?也许可以。更富个性化的治疗?可能可以。

甚至……预防 1 型糖尿病的出现。

我们在此敬候佳音。这些研究者、科学家和医生有海量的数据要收集和分析(预估到 2020 年会有2,314 艾字节

我最期待的是什么?一种新的疗法,能够重新焕发我的胰腺,这样我就不必再注射胰岛素了?不是。自动化的直接胰岛素注射结合实时血糖监测?也不是。

我最期待的是,当我的孩子(也许是孩子的孩子)谈起 1 型糖尿病时,用的是过去时的时态,因为那时糖尿病已不复存在。我希望 1 型糖尿病患者成为仅存在于历史课本上的知识。

Doug Rollins

Doug 是美光存储业务部高级技术营销工程师,专注于企业固态硬盘方面的工作。

+