7.2 TEXT MINING CONCEPTS AND DEFINITIONS
Text mining (also known as text data mining or knowledge discovery in textual database ) is the semi-automated process of extracting patterns (useful information and knowledge) from large amounts of unstructured data sources.
Text mining is the same as data mining in that it has the same purpose and uses the same processes, but with text mining the input to the process is a collection of unstructured (or less stuctured) data files such as Word documents, PDF files, text excerpts, XML files, etc.
The benefits of text mining is obvious in the area where very large amounts of textual data are being generated, such as law (court orders), academic research (research articles), finance (quarterly reports), medicine (discharge summaries), biology (molecular interactions), etc.
For example, the free-form text-based interactions with customers in the form of complaints (praises) and warranty claims can be used to objectively identify product and service characteristics that are deemed to be less than perfect and can be used as input to better product development and service allocations.
7.2 แนวคิดและคำนิยาม
เหมืองแร่เหมืองแร่ข้อความข้อความ ( ที่รู้จักกันเป็นข้อความข้อมูลการทำเหมืองแร่หรือการค้นพบความรู้ในฐานข้อมูลเดิม ) เป็นกึ่งอัตโนมัติกระบวนการสกัดรูปแบบข้อมูลที่เป็นประโยชน์และความรู้จากจำนวนมากของแหล่งข้อมูลที่ไม่มีโครงสร้าง .
การทำเหมืองข้อมูลเป็นเช่นเดียวกับการทำเหมืองข้อมูลที่มีวัตถุประสงค์เดียวกันและใช้ กระบวนการเดียวกันแต่กับเหมืองแร่ข้อความใส่เพื่อกระบวนการเป็นคอลเลกชันที่ไม่มีโครงสร้าง ( หรือน้อยกว่า stuctured ) ข้อมูลไฟล์เช่นเอกสาร Word , ไฟล์ PDF , ข้อความข้อความที่ตัดตอนมา , ไฟล์ XML , ฯลฯ
ประโยชน์ของการทำเหมืองข้อมูลจะชัดเจนในพื้นที่ที่มีขนาดใหญ่มาก ปริมาณของข้อมูลต้นฉบับเดิมที่ถูกสร้างขึ้น เช่น กฎหมาย ( คำสั่งศาล ) , การวิจัยทางวิชาการ ( บทความวิจัย ) , การเงิน ( รายงานรายไตรมาส )ยา ( สรุป Discharge ) ชีววิทยา ( ปฏิสัมพันธ์ระดับโมเลกุล ) ฯลฯ
ตัวอย่างเช่น รูปแบบการปฏิสัมพันธ์กับลูกค้าในรูปแบบของข้อร้องเรียน ( สรรเสริญ ) และการรับประกันการเรียกร้องสามารถใช้วัตถุระบุสินค้าและบริการลักษณะที่ถือว่าเป็นน้อยกว่าที่สมบูรณ์แบบและสามารถใช้เป็นข้อมูลเพื่อการพัฒนาที่ดีขึ้นของผลิตภัณฑ์และการจัดสรร
บริการ .
การแปล กรุณารอสักครู่..