然而研究表明如果,如果单独用分布式数据流系统去处理非结构化图形数据,性能会比专用的图处理系统很差。回过头来说,作者认为,通过识别专用图形计算中的基本数据流模式,并重新优化图处理系统中的数据流,我们可以在通用分布式数据流框架内利用专用图处理系统的优势。所以GraphX就是利用专用图处理系统中基本的数据处理模型,利用其中的一些GAS思想,来优化分布式数据流系统去处理图数据。接下来我们就来了解一下GraphX是如何进行图计算的。 2. GraphX Computing Model
2.2 GraphX Main Idea
它的主要思想是通过构造出这样一个Triplet 三元组视图这样的一个结构。这个结构是通过将顶点RDD和边RDD进行Join操作得到这样一个三元组信息。为什么要得到这样一个Triplet 三元组视图这样的一个结构。最主要的原因是因为这个三元组视图包括源顶点属性、目标顶点属性、以及边属性。这样我们就可以通过一些类似于专业图处理系统的GAS计算模型进行 类似MpaReduce思想的图形计算。