To illustrate this concept, let us

To illustrate this concept, let us consider the logical path access
operator described above. A straightforward physical implementation
may parse the complete file and return only the portions that
correspond to the path. However, this physical operator can be very
inefficient if the file is large and the path is selective, since it will
perform wasteful work. As an alternative, we plan to develop a
physical path access operator based on the concept of fragmented
parsing. The basic idea is to record metadata describing the schema
of the file contents and the byte extents associated with the different
parts of the schema. The schema metadata can be obtained by
examining the header of the file, doing a limited parsing of the file
contents, or summarizing and compressing the information resulting
from a full parse of the file. The physical operator can match the
path against the schema, and then invoke the parser to selectively
parse the subset of the byte stream that is relevant for the path. Returning
to our previous example, the operator will only parse the
parts of the file corresponding to publication titles and abstracts.
Another relevant idea is the use of indexing. This approach is already
used in file systems that support keyword queries over files,
but in a more limited context. In Damasc, indexing is applied on
the structure of file data and not just on keywords. Moreover, index
accesses may be combined with parsing in order to provide
the final results. For instance, an index may identify the offsets of
publication records whose title contains certain keywords, and then
these records may be parsed in order to retrieve the corresponding
abstracts. This is again an application of the general idea of fragmented
parsing, but with a different implementation.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

การอธิบายแนวคิดนี้ ให้เราพิจารณาถึงเส้นทางตรรกะผู้ปฏิบัติงานที่อธิบายไว้ข้างต้น ดำเนินการจริงตรงไปตรงมาอาจแยกแฟ้มสมบูรณ์ และส่งคืนเฉพาะส่วนที่สอดคล้องกับเส้นทาง อย่างไรก็ตาม ตัวดำเนินการทางกายภาพนี้สามารถมากถ้าแฟ้มมีขนาดใหญ่ และเส้นทางเลือก เนื่องจากมันจะต่ำทำงาน wasteful เป็นทางเลือกหนึ่ง เราจะพัฒนาเป็นเส้นทางกายภาพเข้าดำเนินตามแนวคิดของกระจัดกระจายแยกวิเคราะห์ ความคิดพื้นฐานคือการบันทึกดาตา schemaเนื้อหาของแฟ้มและจัดสรรไบต์ที่เกี่ยวข้องต่าง ๆส่วนของแบบแผน เค้าร่างข้อมูลเมตาได้ด้วยตรวจสอบส่วนหัวของแฟ้ม ทำการแยกวิเคราะห์จำกัดของแฟ้มเนื้อหา หรือการสรุป และการบีบอัดข้อมูลได้จากแยกที่เต็มรูปแบบของแฟ้ม ตัวดำเนินการทางกายภาพที่สามารถจับคู่การเส้นทางโดยเทียบกับ schema และจากนั้น เรียกใช้ตัวแยกวิเคราะห์เพื่อเลือกแยกย่อยของกระแสข้อมูลไบต์ที่เกี่ยวข้องกับเส้นทาง ความอย่างก่อนหน้านี้ การดำเนินการจะเฉพาะแยกส่วนของแฟ้มที่สอดคล้องกับชื่อสิ่งพิมพ์และบทคัดย่อจากการใช้ดัชนีความคิดที่เกี่ยวข้องอื่นได้ วิธีการนี้อยู่แล้วใช้ในระบบแฟ้มที่สนับสนุนคำถามไฟล์แต่ ในบริบทที่จำกัดมากขึ้น ใน Damasc การทำดัชนีจะใช้ในโครงสร้าง ของแฟ้มข้อมูล และไม่เพียงแต่ ในคำสำคัญ นอกจากนี้ ดัชนีหาอาจถูกรวมเข้ากับการแยกวิเคราะห์เพื่อให้ผลสุดท้าย ตัวอย่าง ดัชนีอาจระบุการปรับค่าพิมพ์ระเบียนที่มีชื่อประกอบด้วยคำสำคัญบาง แล้วเรกคอร์ดเหล่านี้อาจสามารถแยกวิเคราะห์เพื่อเรียกให้สอดคล้องกับบทคัดย่อจากการ นี้เป็นอีกครั้งด้วยการประยุกต์ความคิดทั่วไปของอยู่อย่างกระจัดกระจายแยก วิเคราะห์ แต่ มีการดำเนินการต่าง ๆ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เพื่อแสดงให้เห็นแนวคิดนี้ให้เราพิจารณาการเข้าถึงเส้นทางตรรกะประกอบการอธิบายไว้ข้างต้น
การดำเนินการตรงไปตรงมาทางกายภาพอาจแยกไฟล์ที่สมบูรณ์และกลับมาเพียงบางส่วนที่สอดคล้องกับเส้นทาง อย่างไรก็ตามผู้ประกอบการทางกายภาพนี้ได้อย่างไม่มีประสิทธิภาพหากไฟล์ที่มีขนาดใหญ่และเส้นทางที่เลือกเพราะมันจะปฏิบัติงานสิ้นเปลือง ในฐานะที่เป็นทางเลือกที่เราวางแผนที่จะพัฒนาผู้ประกอบการเข้าถึงเส้นทางกายภาพขึ้นอยู่กับแนวคิดของการแยกส่วนแยก แนวคิดพื้นฐานคือการเมตาดาต้าบันทึกอธิบายเค้าร่างของเนื้อหาไฟล์และขอบเขตไบต์ที่เกี่ยวข้องกับการที่แตกต่างกันในส่วนของสคีมา เมตาดาต้าคีสามารถหาได้โดยการตรวจสอบส่วนหัวของไฟล์ที่ทำแยก จำกัด ของไฟล์เนื้อหาหรือการสรุปและการบีบอัดข้อมูลที่เกิดจากการแยกเต็มรูปแบบของไฟล์ ผู้ประกอบการทางกายภาพสามารถตรงกับเส้นทางกับคีมาแล้วเรียกตัวแยกวิเคราะห์เพื่อคัดเลือกแยกย่อยของกระแสbyte ที่เกี่ยวข้องสำหรับเส้นทาง กลับไปที่ตัวอย่างก่อนหน้านี้ผู้ประกอบการจะแยกชิ้นส่วนของแฟ้มที่สอดคล้องกับชื่อสิ่งพิมพ์และบทคัดย่อ. อีกหนึ่งความคิดที่เกี่ยวข้องคือการใช้การจัดทำดัชนี วิธีการนี้มีอยู่แล้วมาใช้ในระบบไฟล์ที่รองรับคำสั่งคำหลักมากกว่าไฟล์แต่ในบริบทที่ จำกัด มากขึ้น Damasc ในการจัดทำดัชนีถูกนำไปใช้ในโครงสร้างของแฟ้มข้อมูลและไม่เพียงแต่คำหลัก นอกจากนี้ดัชนีการเข้าถึงอาจจะรวมกับการแยกวิเคราะห์เพื่อที่จะให้ผลสุดท้าย ยกตัวอย่างเช่นดัชนีอาจระบุชดเชยของบันทึกสิ่งพิมพ์ที่มีชื่อมีบางคำแล้วบันทึกเหล่านี้อาจจะแยกวิเคราะห์เพื่อที่จะดึงที่สอดคล้องกันบทคัดย่อ นี่เป็นอีกครั้งที่การประยุกต์ใช้ความคิดทั่วไปของการแยกส่วนแยก แต่มีที่แตกต่างกันการดำเนินการ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

แสดงให้เห็นถึงแนวคิดนี้ ให้เราพิจารณาตรรกะเส้นทางเข้าถึง
ผู้ประกอบการที่อธิบายข้างต้น มีการแยกทางกายภาพ
ตรงไปตรงมาอาจแฟ้มเสร็จสมบูรณ์ และส่งกลับเฉพาะส่วนที่
สอดคล้องกับเส้นทาง อย่างไรก็ตาม ผู้ประกอบการทางกายภาพนี้สามารถมาก
ไม่ได้ผลถ้าไฟล์มีขนาดใหญ่และเป็นเส้นทางที่เลือก เพราะจะสิ้นเปลือง
การดําเนินงาน เป็นทางเลือกเราวางแผนที่จะพัฒนาผู้ประกอบการ
เส้นทางการเข้าถึงทางกายภาพบนพื้นฐานของแนวคิดของการแยกส่วน
การแยกวิเคราะห์ แนวคิดพื้นฐานคือการบันทึกข้อมูลอธิบาย schema
ของเนื้อหาแฟ้มและไบต์ extents ที่เกี่ยวข้องกับชิ้นส่วนที่แตกต่างกัน
จากสคีมา metadata schema สามารถรับได้โดย
ตรวจสอบส่วนหัวของแฟ้ม , ทำจำกัดวจีวิภาคของเนื้อหาแฟ้ม
,หรือ การสรุปและการบีบอัดข้อมูลที่เกิด
จากเต็มแยกของไฟล์ ผู้ประกอบการทางกายภาพสามารถตรงกับ
เส้นทางกับสคีมาและจากนั้นเรียก parser เพื่อเลือก
วิเคราะห์ย่อยของไบต์ลำธารที่เกี่ยวข้องกับเส้นทาง กลับมา
เพื่อตัวอย่างก่อนหน้านี้ของเรา ผู้ประกอบการจะแยก
ส่วนของแฟ้มที่สอดคล้องกับชื่อเรื่องและบทคัดย่อ
สิ่งพิมพ์ .อีกหนึ่งความคิดที่เกี่ยวข้องคือการใช้ดัชนี . วิธีการนี้มีอยู่แล้วในระบบแฟ้มที่สนับสนุน
ใช้คำหลักที่ค้นหาผ่านไฟล์
แต่ในบริบทจำกัดเพิ่มเติม ใน damasc ดัชนีที่ใช้ใน
โครงสร้างของแฟ้มข้อมูลและไม่เพียง แต่ในคำ นอกจากนี้ ดัชนี
เข้าอาจจะรวมกับการแยกเพื่อให้
ผลลัพธ์สุดท้าย เช่น ดัชนีอาจระบุเซตของ
บันทึกสิ่งพิมพ์ที่มีชื่อประกอบด้วยคำหลักบางคำแล้ว
บันทึกเหล่านี้อาจเป็นแจงเพื่อดึงบทคัดย่อเหมือนกัน

นี้เป็นอีกครั้งที่การประยุกต์ใช้ความคิดทั่วไปของการแยกส่วน
แจง แต่กับการใช้งานที่แตกต่างกัน

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.