Graph Database ภาคทฤษฎี แบบมึนๆ

  • Volume คือ ข้อมูลที่มีปริมาณตั้งแต่ระดับ Terabytes หรือมีขนาด 10¹² ขึ้นไป
  • Variety คือ ข้อมูลที่มีความหลากหลายจากแหล่งที่มาของข้อมูล เช่น จากแหล่ง Social Network, Data base หรือ Data warehouse ต่างๆ ซึ่งเราสามารถจำแนกได้เป็น 3 กลุ่ม ดังนี้
- Structured Data คือ ประเภทข้อมูลที่ถูกจัดเก็บตามรูปแบบหรือโครงสร้างที่ถูกกำหนดเอาไว้ โดยประกอบไปด้วย ชื่อฟิลด์, ชนิดของข้อมูล, และค่าของข้อมูลตามโครงสร้างที่กำหนดเอาไว้- Semi-Structured Data คือ ข้อมูลที่มีรูปแบบของข้อมูล แต่ไม่ได้แสดงในรูปแบบของ Table เช่นไฟล์ XML- Unstructured Data คือ ข้อมูลที่ไม่ได้มีลักษณะตายตัว เช่น ข้อมูล JSON ที่อาจจะไม่มีจำนวนของ Properties ไม่เท่ากัน
  • Velocity คือ ข้อมูลที่มีการเปลี่ยนแปลงตลอดเวลา และมีอัตราเพิ่มขึ้นอย่างรวดเร็ว ซึ่งรวมไปถึงการสร้างและการประมวลผลของข้อมูล
3V Models (https://www.theviable.co/how-big-data-impact-to-corporate/)
  • Veracity คือ ความน่าเชื่อถือและคุณภาพของข้อมูล เช่น ข้อมูลที่เป็น Fake news ต่างๆ อาจจะทำให้ข้อมูลที่ถูกนำมาวิเคราะห์อาจเกิดความผิดพลาด
  • Value คือ ข้อมูลที่มีประโยชน์ต่อการนำเอามาใช้ประมาลผล เช่น ข้อมูลสภาพอากาศ, การจราจร หรือข้อมูลตลาดหุ้น เป็นต้น
5V Models (https://www.techentice.com/the-data-veracity-big-data/)
6V Models ( https://www.perceptra.tech/6-vs-of-big-data/ )
  • Visualization หรือ การแสดงข้อมูล เพื่อช่วยสำหรับการตัดสินใจและเป็นส่วนที่ผู้ใช้งานสามารถ interact ได้อีกด้วย
  • Viscosity ว่าด้วยเรื่องความเร็วในการเข้าถึงข้อมูลและการประมวลผลข้อมูลที่มีความซับซ้อนสูงมากๆ
V8 Model ( https://www.m-brain.com/technology/ )
https://www.elderresearch.com/blog/42-v-of-big-data
Graph Structured
  • Undirected Graph คือ กราฟที่ไม่มีการระบุทิศทางการไหลของข้อมูล
  • Directed Graph คือ กราฟทีมีการระบุทิศทางการไหลของข้อมูล
Undirected / Directed Graph ( http://omtlab.com/directed-and-undirected-graph/ )
  • Cyclic Graph คือ กราฟเชิงเดี่ยวแบบมีจุดเริ่มต้น และจุดสิ้นสุด และมีความสำพันธ์ที่เชื่อมเข้าหาตัวเอง
Cyclic Graph ( https://www.geeksforgeeks.org/detect-cycle-in-a-graph/ )
  • Acyclic Graph คือ กราฟเชิงเดี่ยวแบบมีจุดเริ่มต้น และจุดสิ้นสุด และไม่มีความสำพันธ์ที่เชื่อมเข้าหาตัวเอง
Acyclic Graph ( https://hazelcast.com/glossary/directed-acyclic-graph/ )
  • Complete Graph คือ กราฟที่ทุก Nodes หรือ Vertex จะเชื่อมต่อเข้าหากัน
Complete Graph ( https://www.researchgate.net/figure/An-example-of-a-complete-graph-with-N-7-vertices-out-of-which-k-2-are-targets_fig5_230570623 )
- https://www.theviable.co/how-big-data-impact-to-corporate/
- https://www.techentice.com/the-data-veracity-big-data/
- Neo4j, วฤษาย์ ร่มสายหยุด. se-ed, 2563
- https://www.geeksforgeeks.org/largest-subset-graph-vertices-edges-2-colors/
- http://omtlab.com/directed-and-undirected-graph/
- https://www.researchgate.net/figure/An-example-of-a-complete-graph-with-N-7-vertices-out-of-which-k-2-are-targets_fig5_230570623
- https://hazelcast.com/glossary/directed-acyclic-graph/
- https://www.geeksforgeeks.org/detect-cycle-in-a-graph/
- http://omtlab.com/directed-and-undirected-graph/
- https://www.perceptra.tech/6-vs-of-big-data/
- https://www.m-brain.com/technology/
- https://www.elderresearch.com/blog/42-v-of-big-data

--

--

--

Love podcasts or audiobooks? Learn on the go with our new app.

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store
วัฒนชัย วงศ์ประเสริฐ

วัฒนชัย วงศ์ประเสริฐ

Rogue Planet

More from Medium

DS PIPELINE — The much needed Data Science Infrastructure Design: Part 1 (The Concept)

Graph Databases

Unifying the model training workflow from three environments to one with AWS SageMaker