Figure 7.1 gives a simple example of the vector representation for four documents.
The term-document matrix has been rotated so that now the terms are the
rows and the documents are the columns. The term weights are simply the count
of the terms in the document. Stopwords are not indexed in this example, and
the words have been stemmed. Document D3, for example, is represented by the
vector (1, 1, 0, 2, 0, 1, 0, 1, 0, 0, 1).
รูปที่ 7.1 ตัวอย่างง่าย ๆ ของการแสดงเวคเตอร์เอกสารสี่อีกมีการหมุนเมตริกซ์เอกสารระยะที่ตอนนี้ มีเงื่อนไขการคอลัมน์แถวและเอกสารได้ คำว่าน้ำหนักเป็นเพียงแค่การนับเงื่อนไขในเอกสาร ทำดัชนี Stopwords ในตัวอย่างนี้ และมีรับ stemmed คำ เอกสาร D3 เช่น จะถูกแสดงโดยการเวกเตอร์ (1, 1, 0, 2, 0, 1, 0, 1, 0, 0, 1)
การแปล กรุณารอสักครู่..

รูปที่ 7.1 ให้เป็นตัวอย่างที่เรียบง่ายของการแสดงเวกเตอร์สี่เอกสาร.
เมทริกซ์ระยะเอกสารได้รับการหมุนเพื่อให้ตอนนี้เงื่อนไขเป็น
แถวและเอกสารที่มีคอลัมน์ น้ำหนักคำเป็นเพียงการนับ
ของคำในเอกสาร คำหยุดไม่ได้จัดทำดัชนีในตัวอย่างนี้และ
คำพูดที่ได้รับการเกิด เอกสาร D3, ตัวอย่างเช่นเป็นตัวแทนจาก
เวกเตอร์ (1, 1, 0, 2, 0, 1, 0, 1, 0, 0, 1)
การแปล กรุณารอสักครู่..

รูปที่ 7.1 ให้ตัวอย่างง่ายๆของเวกเตอร์แทนเอกสาร 4 ฉบับเอกสารเมทริกซ์มีระยะหมุนดังนั้นตอนนี้ เงื่อนไขคือแถวและเอกสารเป็นคอลัมน์ ระยะ น้ำหนักเป็นเพียงนับของข้อตกลงในเอกสาร stopwords ไม่ได้จัดทำดัชนีในตัวอย่างนี้คำพูดที่ได้ถูกบรรเทาเบาบางลงได้ D3 , เอกสารตัวอย่าง แสดงโดยเวกเตอร์ ( 1 , 1 , 0 , 2 , 0 , 1 , 0 , 1 , 0 , 0 , 1 )
การแปล กรุณารอสักครู่..
