วันพฤหัสบดีที่ 20 มกราคม พ.ศ. 2554

20110119 : AI613 Class9_Data Management (cont) and Business Intelligence

Data Management (cont)

Data Warehouse Process
1. ถ้าจำเป็นต้องใช้ Data Warehouse ก่อนอื่นต้องรู้ว่า มีข้อมูลอะไรบ้างในองค์กร (Operational Data) และข้อมูลภายนอก เช่น ข้อมูลคู่แข่ง (มีผลิตภัณฑ์อะไรบ้าง ราคาเท่าไหร่) โดยจะต้องมีการสร้าง Meta Data ด้วย
        2. Data Staging ศัพท์ทางเทคนิคเรียกว่า ETL 
             - Extract การดึงข้อมูลจาก Database ต่างๆ
             - Clean การจัดการกับข้อมูลที่แหว่ง
            - Transform การแปลงข้อมูลที่ไม่มีประโยชน์ให้อยู่ในรูปแบบที่มีประโยชน์ อาจอยู่ในรูปของ Data Cube
             - Load โหลดข้อมูลลง Data Warehouse
        3. Data Warehouse Business Subject ประกอบด้วยหลายๆ Data Cube
        4. Business Views มุมมองของการเรียกหาสิ่งที่อยู่ใน Data Warehouse ใช้เพื่อวิเคราะห์การตัดสินใจ โดยจะถูกอัพโหลดขึ้นในเว็บ แล้วใช้งานบน Dashboard
        5. Information Catalog
        6. Business Intelligence

        Meta Data เป็น Data ของ Data ซึ่งก็คือเป็น Data ที่ใช้อธิบาย Data ที่อยู่ใน Data Warehouse โดย Metadata จะอธิบายว่ามีการ move ข้อมูลมาจาก Database ไหน และ Summarize อะไรไปยังไงบ้าง

        The Data Mart เป็น Small scale ของ Data Warehouse เนื่องจากเดิมข้อมูลทั้งหมดจะอยู่ใน Enterprise Data Warehouse แล้วระบบอาจจะเกิดการ Overload เวลาที่มีคนใช้พร้อมกันมากๆ จึงเกิด Data Mart ขึ้น ซึ่ง Data Mart จะมี 2 แบบ คือ
        1. แบบ Replicated จะมี Enterprise Data Warehouse ก่อน แล้วค่อย Replicate บางส่วนที่ต้องการมาเป็น Data Mart
        2. แบบ Stand-alone data marts เกิดจากกรณีที่องค์กรยังไม่พร้อมทำ Enterprise Data Warehouse จึงเริ่มที่การทำ Data Mart เป็นของตัวเองไปก่อน พอถึงจุดที่ทุกฝ่ายพร้อม ค่อยเอา Data Mart มารวมกัน

        The Data Cube คือ ฐานข้อมูลที่มีหลายมิติ ทำให้ Query ได้ดีขึ้น มีจุดมุ่งหมายที่ชัดเจนขึ้น เป็นประโยชน์ในการ Slice & Dice เพื่อใช้ในการวิเคราะห์ของผู้บริหารได้

----------------------------------------------------------

Business Intelligence (BI)
        
        BI ไม่ใช่ระบบสารสนเทศ แต่เป็น Tool ในการจัดการข้อมูล ซึ่งไม่ได้เป็น Requirement ที่ว่า การทำ BI ต้องมี Data Warehouse แต่การดึงข้อมูลจาก Database อาจเจอปัญหา Inconsistency ได้

BI Architecture
        - Data extraction and Integration การรวบรวมข้อมูลจากแหล่งต่างๆ
        - Data Mining, query, and analysis tools การทำข้อมูลให้อยู่ในรูปแบบที่เป็นประโยชน์ในการวิเคราะห์ข้อมูล และวิเคราะห์ข้อมูลด้วยเครื่องมือต่างๆ
        - Enterprise Reporting Systems ใช้ในการเตรียมข้อมูลให้ผู้บริหาร

Business Performance Management (BPM) ทำหน้าที่บริหารจัดการผลการดำเนินงาน เพื่อให้เกิด Quickly และ Easily ซึ่งการทำ BPM จะเป็นการวัดผลเชิงกลยุทธ์ โดยเทียบกับ KPI แล้วนำเสนอบน Dashboard

Online Analytical Processing (OLTP) เป็นจุดเริ่มต้นของผู้บริหารในการใช้ระบบสารสนเทศ

Data Mining เป็นกระบวนการในการดึงข้อมูลจากฐานข้อมูลต่างๆ เพื่อค้นหารูปแบบและความสัมพันธ์ของข้อมูล เพื่อให้ได้ข้อมูลที่สำคัญและเป็นประโยชน์ในการตัดสินใจ

Yield from Data mining มี 5 รูปแบบ ได้แก่
- Clustering การจัดกลุ่มข้อมูล โดยไม่ได้กำหนดกลุ่มไว้ล่วงหน้า
- Classification การจัดกลุ่มโดยกำหนดกลุ่มไว้ล่วงหน้า แล้วจัดข้อมูลเข้าไปอยู่ในกลุ่มนั้นๆ
- Association ผลสืบเนื่องที่เกิดจากเหตุการณ์ 2 เหตุการณ์ มีการเชื่อมโยงกัน
- Sequence discovery พบรูปแบบหรือเหตุการณ์ที่มักจะเกิดขึ้น
- Prediction อาจพบข้อมูลที่มีแนวโน้มหรือรูปแบบที่สามารถคาดการณ์สิ่งที่อาจเกิดขึ้นได้

Text Mining คือ การทำ Data Mining สำหรับข้อมูลที่เป็น Unstructured Data ซึ่งอาจเป็นได้ทั้งตัวเลข ตัวหนังสือ แต่ไม่สามารถจับรูปแบบที่แน่นอนได้

Web Mining คือ การทำ Text Mining ในรูปแบบหนึ่งที่จะเกิดขึ้นบนเว็บไซต์ ซึ่งจะช่วยเพิ่มความสามารถให้กับเว็บไซต์ได้


น.ส.จิราพร พรพัฒนกุลฑล
ID NO. 5202112743

ไม่มีความคิดเห็น:

แสดงความคิดเห็น