รู้จักกับเหมืองข้อมูล (Data Mining)

--

ความหมายที่ 1 : การวิเคราะห์ข้อมูลจากข้อมูลจำนวนมากเพื่อหาความสัมพันธ์ของข้อมูลโดยทำการจำแนกประเภท แนวทาง และความสัมพันธ์ที่ซ่อนอยู่ในชุดข้อมูลนั้น โดยใช้หลักคณิตศาสตร์และสถิติ การรู้จำรูปแบบ (Pattern Recognition) การเรียนรู้ของเครื่อง (Machine Learning) และฐานข้อมูล เพื่อให้ได้องค์ความรู้ใหม่ สามารถนำไปใช้ประกอบการตัดสินใจในด้านต่างๆได้

ความหมายที่ 2 : การทำเหมืองข้อมูลเป็นการค้นหาความรู้ที่เป็นประโยชน์และน่าสนใจบนฐานข้อมูลขนาดใหญ่ (Knowledge Discovery from very large in Databases — KDD) โดยนำข้อมูลที่มีอยู่มาวิเคราะห์แล้วดึงความรู้ในส่วนที่สำคัญออกมาวิเคราะห์หรือทำนายสิ่งต่างๆที่เกิดขึ้น

การค้นหาความรู้ที่แฝงอยู่ในข้อมูลเป็นกระบวนการขุดค้นสิ่งที่เราสนใจซึ่งแตกต่างกับระบบฐานข้อมูลที่ต้องอาศัยคำสั่ง เช่น คำสั่ง SQLซึ่งเป็นภาษาที่ได้รับความนิยมมากในด้านการจัดการฐานข้อมูล แต่การทำเหมืองข้อมูลจะมีวิธีการ โดยปกติจะเป็น Machine Learning Tools

ประโยชน์ของการใช้เหมืองข้อมูล

  • ด้านการพัฒนาเว็บไซต์ เช่น การโฆษณา , การเพิ่มประสิทธิภาพและความสามารถของ Search Engine เป็นต้น
  • ด้านวิทยาศาสตร์ เช่น การค้นหายารักษาโรค ดาราศาสตร์ เป็นต้น
  • ด้านธุรกิจ เช่น การเจาะกลุ่มตลาด การวางแผนด้านการผลิต จัดการกลุ่มลูกค้า การโฆษณา เป็นต้น
  • ด้านการเงิน ทำเหมืองข้อมูลตัดสินว่าควรอนุมัติเครดิตให้ลูกค้ารายใดบ้าง ใช้ในการคาดการความน่าจะเป็นว่าธุรกิจนั้นมีโอกาสล้มละลายหรือไม่
  • ด้านการเกษตร จำแนกประเภทโรคของพืช
  • ด้านอาชญวิทยา วิเคราะห์ลายนิ้วมือ
  • ด้านอวกาศ วิเคราะห์ข้อมูลที่ส่งมาจากดาวเทียม

วิวัฒนาการในการทำเหมืองข้อมูล

  • 1960 — เทคโนโลยีฐานข้อมูลเริ่มมาจากไฟล์ประมวลผลพื้นฐาน
  • 1970 — พัฒนามาเป็นการจัดเก็บข้อมูลแบบตารางมีเครื่องมือในการเข้าถึงข้อมูลเรียกว่า Query Langauge
  • 1980 — พัฒนาและปรับปรุงระบบจัดการฐานข้อมูล นำไปสู่การจัดเก็บข้อมูลจำนวนมากที่มีความซับซ้อนและมีประสิทธิภาพ
  • 1990 — ปัจจุบันสามารถเก็บข้อมูลได้หลากหลายรูปแบบ แตกต่างกันทั้งระบบปฏิบัติการและการจัดเก็บข้อมูล ซึ่งการนำข้อมูลจากหลายแหล่ง หลายช่วงเวลามารวมกันและจัดเก็บเป็นรูปแบบเดียวจะเรียกว่าคลังข้อมูล (Data warehouse) เพื่อความสะดวกในการกลั่นกรอง วิเคราะห์ข้อมูลจนถึงการประมวลผลเชิงวิเคราะห์แบบออนไลน์

เนื่องจากมีปริมาณข้อมูลที่มากมายมหาศาลสะสมไว้บนฐานข้อมูลขนาดใหญ่ ส่งผลให้เกิดการคิดค้นเครื่องมือช่วยในการวิเคราะห์ข้อมูลและหาความเป็นไปได้ของข้อมูลทั้งหมดที่เป็นประโยชน์ นั่นคือ “การทำเหมืองข้อมูล”

ประเภทของข้อมูลที่สามารถทำเหมืองข้อมูล

  • ฐานข้อมูลตาราง (Relational Database) เป็นฐานข้อมูลที่จักเก็บในรูปแบบตาราง โดยในตารางประกอบด้วยแถวและคอลัมน์
  • คลังข้อมูล (Data Warehouse) เป็นฐานข้อมูลที่รวบรวมข้อมูลจากหลายแหล่ง หลายช่วงเวลามาจัดเก็บในแหล่งเดียวกันและรูปแบบเดียวกัน
  • ฐานข้อมูลรายการ (Transaction Database) เป็นฐานข้อมูลที่จัดเก็บข้อมูลแต่ละรายการแทนด้วยเหตุการณ์ในขณะใดขณะหนึ่ง เช่น ข้อมูลใบเสร็จรับเงิน จะเก็บในรูปแบบชื่อลูกค้าและรายการสินค้าที่ลูกค้ารายนั้นซื้อ
  • ฐานข้อมูลขั้นสูง (Advance Database) ฐานข้อมูลที่จักเก็บในแบบอื่นๆ เช่น มัลติมีเดีย ไฟล์ตัวอักษร ข้อมูลในรูปแบบเว็บ เป็นต้น

ลักษณะเฉพาะของข้อมูล

  • ข้อมูลที่มีขนาดใหญ่เกินที่จะพิจารณาความสัมพันธ์ได้โดยตรง
  • ข้อมูลที่มาจากหลายแหล่งหลายระบบปฏิบัติการหรือหลายระบบจัดการฐานข้อมูล
  • ข้อมูลที่ไม่มีการเปลี่ยนแปลงตลอดช่วงเวลาที่ทำเหมืองข้อมูล
    ( จะส่งผลต่อการวิเคราะห์และประมวลผลข้อมูล )

ช่องทางการสนับสนุน
🎓คอร์สเรียน Udemy | 🛒ซื้อของผ่าน Shopee

🌎 ติดตามข่าวสารเพิ่มเติมได้ที่
Facebook | YouTube | TikTok

--

--

KongRuksiam Studio

🚀 เรียนรู้การเขียนโปรแกรมนอกห้องเรียน