4.1 Document IndexingThe first stag

4.1 Document Indexing
The first stage of information retrieval is document indexing. Each indexed document is represented as a vector of terms contained by the document and weights of each term. Weight of a term describes how important that term is to the document, e.g. terms from documents’ title will be more important than terms from the footer. The process of creating the vector includes stop words removal and stemming. Stop words like ‘of’, ‘an’, ‘the’, and etc are removed as there are not relevant to the document abstract [10]. Words suffixes – like ‘ed’, ‘ion’, ‘ing’, ‘ions’ can be removed to avoid recording different variants of a single word.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

4.1 เอกสารดัชนีระยะแรกของการเรียกข้อมูลเป็นเอกสารการทำดัชนี เอกสารแต่ละดัชนีจะแสดงเป็นเวกเตอร์อยู่เอกสารและน้ำหนักของเงื่อนไขแต่ละเงื่อนไข น้ำหนักของคำอธิบายถึงความสำคัญว่าคำว่าใช้เอกสาร เช่นเงื่อนไขจากชื่อเรื่องของเอกสารจะสำคัญกว่าเงื่อนไขจากส่วนท้าย กระบวนการสร้างเวกเตอร์รวมถึงกำจัดคำหยุดและประเทศ หยุดคำเช่น 'ของ', ' an' 'ที่' และฯลฯ จะถูกเอาออกเนื่องจากมีไม่เกี่ยวข้องกับบทคัดย่อเอกสาร [10] คำส่วนต่อท้าย – เช่น 'และ' 'ไอออน' 'ing', 'กัน' คุณสามารถเอาออกเพื่อหลีกเลี่ยงการบันทึกตัวแปรแตกต่างกันของคำเดียวกัน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

4.1
เอกสารการทำดัชนีขั้นตอนแรกของการดึงข้อมูลเป็นเอกสารการจัดทำดัชนี แต่ละเอกสารการจัดทำดัชนีจะแสดงเป็นเวกเตอร์ของข้อตกลงที่มีอยู่โดยเอกสารและน้ำหนักของแต่ละระยะ น้ำหนักของคำที่อธิบายถึงวิธีการที่สำคัญที่ยาวคือการเอกสารข้อตกลงเช่นจากเอกสารชื่อ 'จะมีความสำคัญมากกว่าแง่จากส่วนท้าย กระบวนการของการสร้างเวกเตอร์รวมถึงการกำจัดหยุดคำพูดและการเกิด หยุดคำเช่น 'ของ' 'ว่า' 'ว่า' และอื่น ๆ จะถูกลบออกเนื่องจากมีไม่เกี่ยวข้องกับนามธรรมเอกสาร [10] คำต่อท้าย - เช่น 'เอ็ด', 'ไอออน', 'ไอเอ็นจี', 'ไอออน' สามารถถอดออกได้เพื่อหลีกเลี่ยงการบันทึกสายพันธุ์ที่แตกต่างกันของคำเดียว

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

4.1 ดัชนีเอกสาร
ขั้นตอนแรกของการดึงข้อมูลมีการสร้างดัชนีเอกสาร แต่ละดัชนีเอกสารแสดงเป็นเวกเตอร์ของข้อตกลงที่มีอยู่ โดยเอกสาร และน้ำหนักของแต่ละเทอม น้ำหนักของคำอธิบายวิธีการที่สำคัญคำที่ในเอกสาร เช่น เอกสารข้อตกลงจากชื่อเรื่องจะสำคัญกว่าข้อตกลงจากส่วนท้ายกระบวนการของการสร้างเวกเตอร์รวมถึงคำหยุดการกำจัดและกั้น . หยุดคำพูดของ ' ' , ' ' , ' ' , และ ฯลฯ จะถูกลบออกเป็นมีไม่ที่เกี่ยวข้องกับเอกสารที่เป็นนามธรรม [ 10 ] คำที่ต่อท้าย ( เช่น ' เอ็ด ' , ' รายละเอียด ' , ' ing ' , ' อิออน ' สามารถถอดออกได้เพื่อหลีกเลี่ยงการบันทึกสายพันธุ์ที่แตกต่างกันของคำเดียว

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.