谷歌推出交互式数据探索与可视化工具 Cloud Datalab

下一篇文章

谷歌将 Divshot 收归自己的 Firebase 团队

 

谷歌在今天推出了Cloud Datalab,这是一款用于数据探索、分析与可视化的简易交互式工具。谷歌向我们表示,这项服务的目的是为了帮助开发者 “从原始数据中获取分析结果,并以快速、简单和低成本的方式分享和发布数据报告。”

datalab-dashboard

这项服务采用的是 Jupyter Notebook 格式(之前叫做 IPython),这种格式可以使用动态代码和可视化内容创建文档。Jupyter 是数据科学领域的知名工具,而且它已经构建起了一个蓬勃发展的生态系统,这点应该会让这款谷歌新工具更容易起步。

开发者可以利用 Cloud Datalab 探索、转换、可视化和处理位于 Google BigQuery、Compute Engine 和 Cloud Storage 的数据。这款工具兼容 Python、SQL 和 JavaScript(使用 BigQuery 的用户自定义功能)编程语言。开发者可以在这些数据的基础上建立用于 BigQuery 开发的数据处理流程,或者建立机器学习模型。

如果要对数据进行可视化的话,开发者可以使用 Google Charting 或者 Python 库 matplotlib

intro-notebook

开始使用之前,你需要先将 Cloud Datalab 部署为一个 App Engine 应用——这也是这项服务在免费测试期结束后的收费模式(谷歌目前还没有公布价格信息)。在完成部署之后,你就可以开始新项目并创建新的笔记本。这项服务自带了一些预设笔记本,让你可以更方便地开始工作。

Cloud Datalab 有点类似于那些商业智能工具,比如最近公布的 Amazon QuickSight。不过从目前来看,谷歌似乎没有将它定位成 “商业智能”,它也不是一款面向非技术用户的工具。

Datalab 是一款开源工具,这是它的一大优点。想要完善它的开发者可以直接在 GitHub 上进行派生(fork)或者提交拉取需求(pull request)。

除了 Cloud Datalab 以外,谷歌还在今天推出了 Google Cloud Shell。在使用这款工具之后,开发者可以从 Google Developers Console 通过命令行获取他们存放在 Google Cloud Platform 上的计算资源。

现在 Google Cloud Platform 的所有开发者都可以使用这个新的 shell。每个 shell 都由一个临时的 Compute Engine 虚拟机驱动,并配有 5 GB 永久储存容量,它还可以接入 Google Cloud SDK 等工具。

xfu-umhvslu5llypr3vqtmu51hfnemg5wfev5doenw4u9ed7utavdouq8amk8miu4lsqr6bvaqe0aedwofrm2qbteecdersnmsdeqkxzp7vw1kyyxwdjxmlkaiblfq1dnabsg4is

题图来自:R2HOX/FLICKR,根据 CC BY-SA 2.0 协议授权

翻译:关嘉伟(@consideRay

Google Launches Cloud Datalab, An Interactive Tool For Exploring And Visualizing Data