The indexing process begins with co

The indexing process begins with collecting the available set of documents by the data gatherer. The parser converts them to a stream of plain text. For each document format, a parser has to be implemented. In the analysis phase, the stream of data is tokenized according to predefined delimiters and a number of operations are performed on the tokens. For example, the tokens could be low ercased before indexing. It is also desirable to remove all stop words. Additionally, it is common to reduce them to their roots to enable phonetic and grammatical similarity searches.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

กระบวนการทำดัชนีเริ่มต้น ด้วยการรวบรวมชุดพร้อมใช้งานเอกสารโดยการรวบรวมข้อมูล ตัวแบ่งที่แปลงกระแสข้อมูลของข้อความล้วน สำหรับแต่ละรูปแบบเอกสาร ตัวแยกวิเคราะห์ที่มีการดำเนินการ ในขั้นตอนการวิเคราะห์ กระแสข้อมูลเป็น tokenized ตามตัวคั่นที่กำหนดไว้ล่วงหน้า และดำเนินงานจะทำในสัญญาณ ตัวอย่าง สัญญาณอาจจะ ercased ต่ำก่อนการทำดัชนี ก็ยังต้องเอาคำหยุดทั้งหมด นอกจากนี้ มันจะไปลดรากของตนเพื่อให้สามารถค้นหาความคล้ายกันออกเสียง และไวยากรณ์

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

กระบวนการสร้างดัชนีเริ่มต้นด้วยการเก็บรวบรวมชุดที่มีอยู่ของเอกสารโดยรวบรวมข้อมูล แบ่งแปลงให้กระแสของข้อความธรรมดา สำหรับรูปแบบเอกสารแต่ละตัวแยกวิเคราะห์จะต้องมีการดำเนินการ ในขั้นตอนการวิเคราะห์กระแสของข้อมูลจะถูก tokenized ตามตัวคั่นที่กำหนดไว้ล่วงหน้าและจำนวนของการดำเนินงานจะมีขึ้นในราชสกุล ตัวอย่างเช่นสัญญาณที่อาจจะ ercased ต่ำก่อนที่จะจัดทำดัชนี นอกจากนี้ยังเป็นที่พึงปรารถนาที่จะลบคำหยุดทั้งหมด นอกจากนี้ก็เป็นเรื่องธรรมดาที่จะลดพวกเขาไปที่รากของพวกเขาเพื่อให้การออกเสียงและไวยากรณ์การค้นหาความคล้ายคลึงกัน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ขั้นตอนการเริ่มต้นด้วยการรวบรวมชุดของเอกสาร โดยการรวบรวมข้อมูล . parser แปลงให้กระแสของข้อความธรรมดา สำหรับแต่ละรูปแบบเอกสาร แยกวิเคราะห์ได้จะใช้ ในการวิเคราะห์เฟส กระแสของข้อมูลเป็น tokenized ตามที่กำหนดตัวคั่น และหมายเลขของการดำเนินงานจะใช้สัญญาณ ตัวอย่างเช่นสัญญาณอาจจะ ercased ต่ำก่อนที่ดัชนี . มันยังเป็นที่พึงปรารถนาเพื่อลบคำหยุดทั้งหมด นอกจากนี้ โดยทั่วไปเพื่อลดการรากของพวกเขาเพื่อช่วยให้การออกเสียงและไวยากรณ์การค้นหาความเหมือน

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.