AWS开源图谱数据库Netptune查询工具Graph Notebook

AWS上周宣布将原用于图谱数据库Amazon Neptune的Jupyter Notebook工具,以Apache 2.0授权开源出来,供企业在PC机或在AWS环境下,使用这个图谱数据库的查询及可视化工具。

所谓图谱数据库(Graph Database)是一种专业化数据库,它不仅存储客户姓名或购物品项、购物金额等资料,还可以记录资料之间的关系,例如在哪家店买了多少金额等,这种关系资料对于大数据(big data)分析相当关键,结果可用于零售业的购物推荐、安全分析、医学或其他科学研究。AWS就提供了托管图谱数据库Amazon Netpune。

而Jupyter Notebook则是可用于创建和分享文件的开源Web化App,常用于资料科学项目,像是资料清洗、转换、统计建模、机器学习、资料可视化、数值模拟等。Graph Notebook前身即是用于Amazon Neptune的Jupyter Notebook工具。

AWS表示,开源出来的Graph Notebook可跑在PC机、集成电子病历、也可配合Neptune或是其他EC2执行实例使用,只要这些数据库支持Apache TinerPop Gremlin或是RDF/SPARQL 1.1两种查询语言之一,其中Gremlin为较主流的查询语言。Nepune就同时支持两者。

AWS指出,运用Graph Notebook,用户可从图谱资料中可视化节点、边缘或属性,以分析各资料点的关系和规则脉络。此外,通过开源,开发人员也可以对这功能有所贡献和改进。

Graph Notebook相关资源已经放上GitHub。