data. Consider, for example, a full SAP implementation that typically has more than 10,000 tables. Data may be scattered due to technical or organizational reasons. For example, there may be legacy systems holding crucial data or information systems used only at the departmental level. For cross-organizational process mining, e.g., to analyze supply chains, data may even be scattered over multiple organizations. Events can also be captured by tapping of message exchanges [107] (e.g., SOAP messages) and recording read and write actions [36]. Data sources may be structured and well-described by meta data. Unfortunately, in many situations, the data is unstructured or important meta data is missing. Data may originate from web pages,emails, PDF documents, scanned text, screen scraping, etc. Even if data is structured and described by meta data, the sheer complexity of enterprise information systems may be overwhelming, There is no point in trying to exhaustively extract event logs from thousands of tables and other data sources. Data extraction should be driven by questions rather than the availability of lots of data.
 
ข้อมูล พิจารณาตัวอย่างเช่น SAP ใช้เต็มที่มักจะมีมากกว่า 10 , 000 ตาราง ข้อมูลอาจจะกระจัดกระจายไปเนื่องจากเหตุผลทางเทคนิคหรือองค์การ ตัวอย่างเช่นอาจจะมีระบบเก่าถือข้อมูลที่สําคัญข้อมูล หรือระบบที่ใช้เฉพาะในระดับแผนก เพื่อข้ามขั้นตอนขององค์การเหมืองแร่ เช่น วิเคราะห์ โซ่ อุปทานข้อมูลอาจจะกระจายไปทั่วองค์กรหลาย เหตุการณ์ยังสามารถบันทึกโดยการแตะข้อความแลกเปลี่ยน [ 107 ] ( เช่นข้อความ , สบู่ ) และการบันทึกการอ่านและเขียนการกระทำ [ 36 ] แหล่งข้อมูลอาจจะมีโครงสร้างและอธิบาย meta ข้อมูล แต่น่าเสียดายที่ในหลายกรณี ข้อมูลที่ไม่มีโครงสร้างหรือ meta ข้อมูลสำคัญที่ขาดหายไป ข้อมูลอาจจะมาจากหน้าเว็บ , อีเมล ,เอกสาร PDF , สแกนข้อความ , ขูดหน้าจอ ฯลฯ ถ้าเป็นข้อมูลแบบโครงสร้างและอธิบายโดยข้อมูล meta , ความซับซ้อนที่แท้จริงขององค์กรระบบสารสนเทศอาจยุ่งยาก มีจุดในการพยายามที่จะทำสารสกัดจากบันทึกเหตุการณ์จากนับพันของตารางและแหล่งข้อมูลอื่น ๆ การสกัดข้อมูลควรได้รับการขับเคลื่อนโดยคำถามมากกว่าความพร้อมของจำนวนมากของข้อมูล
การแปล กรุณารอสักครู่..
