I.1 DEFINING TEXT MININGText mining

I.1 DEFINING TEXT MINING
Text mining can be broadly defined as a knowledge-intensive process in which a user interacts with a document collection over time by using a suite of analysis tools. In a manner analogous to data mining, text mining seeks to extract useful information from data sources through the identification and exploration of interesting patterns. In the case of text mining, however, the data sources are document collections, and interesting patterns are found not among formalized database records but in the unstructured textual data in the documents in these collections. Certainly, text mining derives much of its inspiration and direction from seminal research on data mining. Therefore, it is not surprising to find that text mining and data mining systems evince many high-level architectural similarities. For instance, both types of systems rely on preprocessing routines, pattern-discovery algorithms, and presentation-layer elements such as visualization tools to enhance the browsing of answer sets. Further, text minin adopts many of the specific types of patterns in its core knowledge discovery operations that were first introduced and vetted in data mining research. Because data mining assumes that data have already been stored in a structured format, much of its preprocessing focus falls on two critical tasks: Scrubbing and normalizing data and creating extensive numbers of table joins. In contrast, for text mining systems, preprocessing operations center on the identification and extraction of representative features for natural language documents. These preprocessing operations are responsible for transforming unstructured data stored in document collections into a more explicitly structured intermediate format, which is a concern that is not relevant for most data mining systems. Moreover, because of the centrality of natural language text to its mission, text mining also draws on advances made in other computer science disciplines concerned with the handling of natural language. Perhaps most notably, text mining exp its techniques and methodologies from the areas of information retrieval, information extraction, and corpus-based computational linguistics.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

I.1 การกำหนดข้อความการทำเหมืองแร่การทำเหมืองข้อความสามารถกำหนดอย่างกว้างขวางเป็นกระบวนการความรู้มากซึ่งผู้ที่โต้ตอบกับคอลเลกชันเอกสารตลอดเวลา โดยใช้ชุดเครื่องมือวิเคราะห์ ในลักษณะคล้ายคลึงกับการทำเหมืองข้อมูล การทำเหมืองข้อความพยายามที่จะแยกข้อมูลที่เป็นประโยชน์จากแหล่งข้อมูลที่ระบุและสำรวจของรูปแบบที่น่าสนใจ ในกรณีของการทำเหมืองข้อความ แต่ แหล่งข้อมูลคือ ชุดของเอกสาร และรูปแบบที่น่าสนใจที่พบ ระหว่างระเบียนของฐานข้อมูลที่เป็นทางไม่ แต่ ในข้อมูลไม่มีโครงสร้างในเอกสารในชุด แน่นอน การทำเหมืองข้อความมาเป็นแรงบันดาลใจและทิศทางจากการทำเหมืองข้อมูลวิจัยบรรลุ ดังนั้น จึงไม่น่าแปลกใจที่ทำเหมืองข้อความการค้นหา และความเหมือนสถาปัตยกรรมระดับสูงหลายโปรแกรมระบบการทำเหมืองข้อมูล เช่น ทั้งสองชนิดของระบบอาศัยกิจวัตร อัลกอริทึมการค้นพบรูปแบบ การประมวลผลเบื้องต้น และองค์ประกอบชั้นนำเสนอเช่นการแสดงเครื่องมือการเรียกดูของตอบชุด เพิ่มเติม ข้อ minin adopts หลายชนิดเฉพาะของรูปแบบในการดำเนินการค้นพบความรู้หลักที่ถูกนำมาใช้ครั้งแรก และผ่านประเมินในการวิจัยการทำเหมืองข้อมูล เนื่องจากการทำเหมืองข้อมูลสันนิษฐานว่า ข้อมูลได้ถูกเก็บไว้ในรูปแบบโครงสร้าง มากของการโฟกัสเบื้องตรงกับงานสอง: ถู normalizing ข้อมูล และสร้างหมายเลขหน้าของตารางรวม ตรงกันข้าม สำหรับข้อความการทำเหมืองแร่ระบบ ศูนย์ปฏิบัติการรหัสและสกัดคุณสมบัติตัวแทนสำหรับเอกสารภาษาธรรมชาติการประมวลผลเบื้องต้น ประมวลผลเบื้องต้นการดำเนินการเหล่านี้มีหน้าที่ในการเปลี่ยนไม่มีโครงสร้างข้อมูลที่เก็บไว้ในคอลเลกชันเอกสารในรูปแบบที่มีโครงสร้างมากขึ้นอย่างชัดเจนกลาง ซึ่งเป็นเรื่องที่ไม่เกี่ยวข้องกับระบบการทำเหมืองข้อมูลส่วนใหญ่ นอกจากนี้ เนื่องจากแห่งของข้อความพันธกิจภาษาธรรมชาติ การทำเหมืองข้อความยังวาดบนเงินในสาขาวิทยาศาสตร์คอมพิวเตอร์อื่น ๆ ที่เกี่ยวข้องกับการจัดการภาษาธรรมชาติ บางทีอาจจะสะดุดตาที่สุด ทำเหมือง exp ของเทคนิคและวิธีการจากการเรียกข้อมูล การสกัดข้อมูล และ corpus ตามภาษาศาสตร์เชิงคำนวณข้อความ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

I.1 กำหนดข้อความ MINING
การทำเหมืองข้อความสามารถกำหนดได้ในวงกว้างเป็นกระบวนการความรู้มากในการที่ผู้ใช้โต้ตอบกับคอลเลกชันเอกสารเมื่อเวลาผ่านไปโดยใช้ชุดเครื่องมือการวิเคราะห์ ในลักษณะคล้ายกับการทำเหมืองข้อมูลการทำเหมืองข้อความพยายามที่จะดึงข้อมูลที่เป็นประโยชน์จากแหล่งข้อมูลผ่านการระบุและการสำรวจของรูปแบบที่น่าสนใจ ในกรณีของการทำเหมืองข้อความ แต่แหล่งข้อมูลที่มีคอลเลกชันเอกสารและรูปแบบที่น่าสนใจที่พบไม่ได้ในหมู่บันทึกฐานข้อมูลที่เป็นทางการ แต่ในข้อมูลที่ไม่มีโครงสร้างที่เป็นข้อความในเอกสารในคอลเลกชันเหล่านี้ แน่นอนว่าการทำเหมืองข้อความมามากของแรงบันดาลใจและทิศทางจากการวิจัยเชื้อในการทำเหมืองข้อมูล ดังนั้นจึงไม่น่าแปลกใจที่จะพบว่าระบบการทำเหมืองข้อความและการทำเหมืองข้อมูลแสดงให้เห็นหลายระดับสูงสถาปัตยกรรมคล้ายคลึงกัน ยกตัวอย่างเช่นทั้งสองประเภทของระบบการพึ่งพาการปฏิบัติ preprocessing ขั้นตอนวิธีการรูปแบบการค้นพบและนำเสนอองค์ประกอบชั้นเช่นเครื่องมือสร้างภาพเพื่อเพิ่มการเรียกดูของชุดคำตอบ นอกจากนี้ข้อความ Minin adopts หลายประเภทเฉพาะของรูปแบบในการดำเนินงานการค้นพบความรู้หลักที่ถูกนำมาใช้เป็นครั้งแรกและการตรวจสอบในการวิจัยการทำเหมืองข้อมูล เพราะการทำเหมืองข้อมูลสันนิษฐานว่าข้อมูลที่ได้รับการจัดเก็บไว้ในรูปแบบโครงสร้างของการมุ่งเน้นมาก preprocessing มันตรงกับวันที่สองงานที่สำคัญ: ขัดและข้อมูล normalizing และการสร้างตัวเลขที่กว้างขวางของตารางร่วม ในทางตรงกันข้ามสำหรับระบบการทำเหมืองข้อความ preprocessing ศูนย์การดำเนินงานในการระบุและการสกัดของคุณสมบัติตัวแทนสำหรับเอกสารภาษาธรรมชาติ การดำเนินงาน preprocessing เหล่านี้มีความรับผิดชอบสำหรับการเปลี่ยนข้อมูลที่ไม่มีโครงสร้างที่เก็บไว้ในคอลเลกชันเอกสารเป็นรูปแบบกลางโครงสร้างอย่างชัดเจนมากขึ้นซึ่งเป็นความกังวลว่าไม่เกี่ยวข้องกับการมากที่สุดระบบการทำเหมืองข้อมูล นอกจากนี้เนื่องจากศูนย์กลางของข้อความภาษาธรรมชาติที่จะปฏิบัติภารกิจของตนการทำเหมืองข้อความยังดึงความก้าวหน้าในสาขาวิชาวิทยาการคอมพิวเตอร์อื่น ๆ ที่เกี่ยวข้องกับการจัดการของภาษาธรรมชาติ บางทีอาจจะเป็นที่สะดุดตาที่สุด, การทำเหมืองข้อความประสบการณ์เทคนิคและวิธีการของมันมาจากพื้นที่ของการดึงข้อมูลการสกัดข้อมูลและคลังข้อมูลตามภาษาศาสตร์

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.