加快数据洞察的速度

高速数据的黄金潜力

数据分类是怎样的?美光业务发展经理 Eric Caward 在描绘一系列数据时,设想了一座大山,其中的每块矿渣和岩石代表着一条信息。乍看之下,这座大山类似于一堆大数据——有可能类似一堆矿渣。但聪明的矿工知道有些山中有薄薄的金矿层。

在数据大山中,这些薄层代表可用于获取更深入见解的宝贵信息。收集的家中温度读数或许看起来不是最有趣的大数据之山,但内部趋势可能非常有用。如果家里在一天当中某个时段趋于过热,跟踪这一趋势可以帮助房主更好地优化供暖系统,节省能源费用。

在砂矿开采(黄金积聚在松散的材料中,需要用水来提取)中,矿工开始淘洗来提取黄金薄层。但是淘洗是一种简单的技术,它不是从大型矿床中提取黄金的最佳方式(就像从海量大数据中获取正确的信息一样)。这就是为什么更高效的矿工会改为使用洗矿槽和筛选设备,来更快处理大型矿床从而发掘宝藏的原因。

计算机如何成为一名熟练的矿工,有效地筛选这座大山(或大数据),从而接近并找到那些薄薄的金矿层?它需要快速进行数据分析,才能有效提取重要信息。云中的温度读数列表从表面上看几乎没有任何意义,但如果计算机系统可以对它扫描,识别其中的趋势,并生成一种解决方案,就会发现黄金。找到了!

为了最好地处理这种高速数据,计算机系统需要配备延迟极小的高效内存。这些趋势隐藏在矿渣中对任何人都没有好处。幸运的是,没有什么能比超高速动态随机存取存储器 (DRAM) 更快地在系统内移动数据。

借助大数据形成高速数据

根据 Entrepreneur 在 2016 年刊登的一篇文章,数据收集速度正以惊人的速度增长。到 2020 年,每个在线者在当时已产生的 44 ZB 数据的基础上,将每秒创建 1.7 GB 新数据。

随着技术在日常监测身体重要器官能力方面的增长 - 无论是通过检测心率和睡眠模式等等的小型可穿戴设备,还是通过监测血糖水平和血压的医疗创新 - 医疗保健组织可以一种革命性的方式协助预防医学。随着物联网设备(无线联网并且可以传输数据的非标准计算设备)普及度激增,用于跟踪患者健康不同元素的工具也在继续增加,每分钟创建的大数据会越来越多。

广告代理商在确定将哪个赞助帖投放到用户的社交媒体新闻源时,必须筛选所有可用数据来查找相关的信息片段,从而向用户有效传递信息。如果做的得当,那么这种选择对于广告商来说就相当于纯黄金。

当人工智能 (AI) 程序查看人们的个人资料时,它会看到很多位的浏览数据 - 可能是亚马逊浏览历史记录、YouTube 订阅框和谷歌搜索历史的组合。高速数据可以将这些信息片段快速串联在一起,在在线购物车中找到汽车商品,记录以前浏览过的“如何更换 2012 款福特探险者刹车片”YouTube 视频,以及注册一致的 DIY 项目文章。在这种情况下,人工智能程序可以轻松为当地汽车零件店生成广告。随着人工智能越来越聪明,数据越来越快,数据显示你已经购买了刹车片,因此广告可能会转而侧重于你完成可能进行的工作所需的单向扳手和千斤顶。

“如果程序使用速度极快的内存系统来即时拦截和解读数据,并且可以立即在网站上推送相关广告,那么可能就会促成点击和销售。”Caward 说。

为了足够快速地拦截该数据集合,运行这些人工智能和机器学习程序的单元需要有足够高的带宽,以便将存储在云中的所有大数据用于特定的社交媒体资料和浏览器历史记录,验明重要的黄金薄层,并在处理单元附近进行分析。Caward 表示,“我们通常称之为热数据”的重要信息越接近系统处理单元,用户看到的返回值越多。这就是为什么美光在创造速度更快、更高效的内存解决方案方面大力投入的原因。

从传统硬盘到固态硬盘并加快速度

并非只有可靠的 DRAM 加速数据在系统中的移动。通过从传统硬盘 (HDD) 移动到固态硬盘 (SSD),系统可以获得宝贵的毫秒级速度。标准硬盘需要进行更多的实际移动来获取信息,然后必须进行实际的旋转以读取数据,耗费了宝贵的时间。

根据 Caward 的说法,改为使用闪存 (SSD) 时,“你并没有实际地移动任何数据,所以可以更快地访问这些数据。”

如今的处理器正在推动速度疆域,并将标准的3 或 4 千兆赫兹速度提升到 4.5 甚至 5 千兆赫兹。Caward 认为,如果你“以纳秒级速度处理数据,并且如果不是必须等待若干微秒,而是等待若干毫秒才能获取数据,那么你的 CPU 不会在额外的时间内做任何事情。”为了避免在获得结果之前浪费这部分时间,内存位置越来越接近处理单元,并设计为 GDDR5、GDDR5X 和 GDDR6 内存形式的高性能计算。

为了在低延迟和高带宽下尽可能快速地移动这些数据,Caward 解释说,内存“实际上焊接在计算单元旁边”。

将高速数据应用于当今的技术

随着速度更快的内存解决方案已经可用并且每天都在改进,机器学习和人工智能出现了无穷无尽的应用,其中包括 Caward 口中的这一代梦寐以求的自动驾驶汽车。这些车辆中的传感器持续监控各种输入——交通信号、车辆位置感知、与其他事物(特别是汽车和人)的接近度,并分析应用于具体情况的行动。

“就好比你将海量信息融入你车中的一台超级计算机,而你正在处理这些数据。”Caward 说,“为便于管理,你从中取出无用的数据。然后进行一些内部处理。接着通过各种网络连接到云端,来进行更多处理,然后做出相应的反应——这样就可以安全无虞地到达目的地。”

高速数据在医生办公室也能产生奇妙作用。你不必向 3,000 名医生发送 CAT 扫描,并让他们一一对细胞进行分析,而是可以将单个 CAT 扫描提交到神经网络,该网络通过分析多年的恶性和非恶性细胞来学习如何识别恶性细胞。

“这些检测速率会上升。”Caward 说,“一旦它被放入计算机并且你拥有高速数据,就可以自动执行。”

由于美光正在推进可提高数据处理速度的产品,因此可以帮助扩展这些类型的应用程序。处理器变得越来越快,并将继续计算越来越多的信息。但是如果给一个 26 核的处理器提供的数据,只有一个核心便能处理,那么其他核心就无所事事了。大数据和高速数据能做的颇多,但前提是它们充分发挥潜力。

“你已经拥有了这块可以处理逻辑的硅芯片,它会保持工作运转。”Caward 说,“但由于它以这样的速度运转,因此必须尽快将数据传输给它。否则,你就是在浪费它的潜力。”

通过使用美光 DRAM 和 SSD 将这些数据快速传输到 CPU,这种潜力就不会白白浪费。系统可以对大数据之山进行分选,找出潜藏在其中的黄金数据片段,从而为新的结论和见解腾出空间。

+