Professional Documents
Culture Documents
林选磊
Sep 25, 2021
1
生产数据是长什么样的?
Lucas 41 Male UK
动图来源:https://towardsdatascience.com/designing-a-3d-healthcare-network-graph-291e4f75e9a5
输入数据格式
地理位置
购买记录
事件
客户画像
图的Schema
浏览记录
订单
查询用例
同构图:顶点只有一种类型,边也只 异构图:顶点可能有多种类型,边也
有一种类型(如社交网络) 有多种类型(如知识图谱)
1 1
S S
2 2
5 1 5
3 2 1 3 2
9 9
图例 1
1
1 1
账户
8 6 8 6
交易
7 7
异构图:保留明细数据,但查询速度慢 同构图:查询速度快,但细节信息缺失
无向边
A B A可以到达B,同样B也可以到达A
有向边+反向边
e1
A B A可以通过e1到达B,B可以通过e2到达A
e2 注:e2是在创建e1的时候自动创建的,
并且拥有和e1一模一样的属性。
采用无向边方案 采用有向边+反向边方案
has_email
has_email
User Email User Email
rev_has_email
采用无向边方案 采用有向边+反向边方案
A A
B C B C
D E F D E F
G H I J G H I J
在这个案例中,通过无向边的方案 通过有向边+反向边的方案可以轻
很难解答用户的问题,因为无向边 易解决这个问题。如果要查询母公
并不提供方向信息,即不知道哪个 司,可以使用虚线的边;如果要查询
是母公司,哪个是子公司。 子公司,则可以使用实线的边。
● 经验法则:哪些可以作为点?哪 ● 如何对层级结构进行建模?
些可以作为边? ● 两个实体间存在多个事件/交易的
● 边类型的颗粒度 情况
● 属性还是顶点? ● 衍生边
● 如何在图中对时间进行建模? ● 根据使用场景设计schema
详参https://www.tigergraph.com.cn/activities/webinar/
顶点级的任务举例: ?
● 已经知道部分顶点的标签(如正常电
话、欺诈电话、广告电话) ?
● 预测未标记的顶点的标签
? ?
预测A和B之间是否
A
有关联关系?
边级的任务举例:
● 已经知道部分顶点之间的连接关系
● 预测任意一对顶点之间是否有连接关
系?
子图级的任务举例:
● 识别密集连接的节点社群
● 描述每个社群的特点
全图级的任务举例:
● 已经知道一些分子的结构及特性
● 根据需要的特性,自动生成新分子
算法库:https://docs.tigergraph.com/tigergraph-platform-overview/graph-algorithm-library
● 如果算法中要嵌入业务逻辑,使用通用的算法不够用怎么
办?
● 举例
○ 官网的环形检测算法
○ 嵌入业务逻辑的环形检测
● 如果数据具有small-world和scale-free的特点,能否根据
这些特点优化算法?
● 举例
○ 通用的弱连通分量算法和强连通分量算法在具有小世
界的特点的数据集上性能一般,可否进一步提升?
○ 针对小世界特点的弱连通分量算法
无环担保链 有环担保链
扫/码/关/注
© 2021. ALL RIGHTS RESERVED. | TIGERGRAPH.COM 26
© 2021. ALL RIGHTS RESERVED. | TIGERGRAPH.COM 27