Figure 1 shows a conceptual overvie

Figure 1 shows a conceptual overview of our approach towards a content aggregation engine for the web. We aim to enable users to harvest information from any web page, regardless of the speciﬁcs of how that information happens to be presented to the user. For this reason, we propose an architecture that abstracts speciﬁc data formats and consolidates all incoming data before it is being processed by further components of the aggregation engine. To this end, all extracted individual data items are transformed to a hierarchical data structure, similar to a JSON document, and merged. This abstraction allows us to extend the system with custom extractors for new data formats and to add support for future semantic markup languages without having to adapt the data integration pipeline. Extractors are software modules that process a web page or web data source, if applicable, and may use any programming technique available to extract information. A number of built-in extractors are described in Sect. 5. In addition, it is important that the extraction engine should not only be able to process numerous, diverse ﬁle formats and semantic markup speciﬁcations, but also allow user-generated content to be fed directly into the system. Manual data entry allows end-users to create new data items in order to capture information that may not yet be available online from existing websites.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

รูปที่ 1 แสดงภาพรวมทางแนวคิดของวิธีการต่อเครื่องยนต์รวมเนื้อหาสำหรับเว็บของเรา เรามุ่งมั่นที่จะให้ผู้ใช้สามารถเก็บเกี่ยวข้อมูลจากเว็บเพใด ๆ ไม่ว่า speciﬁcs ของวิธีที่ข้อมูลเกิดขึ้นที่จะเสนอให้ผู้ใช้ ด้วยเหตุนี้ เรานำเสนอรูปแบบสถาปัตยกรรมที่ abstracts speciﬁc ข้อมูล และรวมข้อมูลขาเข้าทั้งหมดก่อนที่จะถูกประมวลผล โดยคอมโพเนนต์เพิ่มเติมของเครื่องยนต์รวม ด้วยเหตุนี้ ทั้งหมดแยกข้อมูลแต่ละรายการจะเปลี่ยนไปเป็นลำดับชั้นโครงสร้างข้อมูล คล้ายกับเอกสาร JSON และผสาน นามธรรมนี้ช่วยให้เราขยายระบบกับดักแบบกำหนดเองสำหรับรูปแบบข้อมูลใหม่ และเพิ่มการสนับสนุนสำหรับภาษามาร์กอัปตรรกในอนาคต โดยไม่ต้องปรับเปลี่ยนขั้นตอนการรวมข้อมูล ควันมีโมดูลซอฟต์แวร์ที่ดำเนินการกับเว็บเพจหรือเว็บแหล่งข้อมูล ถ้ามี และอาจใช้เทคนิคการเขียนโปรแกรมจะดึงข้อมูล จำนวนของเครื่องในตัวดูดไว้ใน 5 อ นอกจากนี้ มันเป็นสิ่งสำคัญที่เครื่องยนต์ดูดไม่เพียงควรสามารถประมวลผลมากมาย รูปหลากหลายรูปแบบและข้อมูลทางตรรก markup แต่ยัง ช่วยให้ผู้ใช้สร้างเนื้อหาจะถูกป้อนเข้าสู่ระบบโดยตรง ป้อนข้อมูลด้วยตนเองช่วยให้ผู้ใช้สามารถสร้างรายการข้อมูลใหม่เพื่อเก็บข้อมูลที่อาจยังไม่มีออนไลน์จากเว็บไซต์ที่มีอยู่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

รูปที่ 1 แสดงภาพรวมแนวคิดของวิธีการของเราที่มีต่อเครื่องยนต์รวมเนื้อหาสำหรับเว็บ เรามุ่งมั่นที่จะช่วยให้ผู้ใช้ที่จะเก็บเกี่ยวข้อมูลจากหน้าเว็บใด ๆ โดยไม่คำนึงถึงระบุไว้บริการลูกค้าของวิธีการที่ข้อมูลที่เกิดขึ้นที่จะนำเสนอให้กับผู้ใช้ ด้วยเหตุนี้เราจึงนำเสนอสถาปัตยกรรมที่ abstracts speci Fi รูปแบบ C ข้อมูลและรวบรวมข้อมูลทั้งหมดที่เข้ามาก่อนที่มันจะถูกประมวลผลโดยส่วนประกอบเพิ่มเติมของเครื่องยนต์รวม ๆ ด้วยเหตุนี้ทุกสกัดรายการข้อมูลของแต่ละบุคคลจะเปลี่ยนไปเป็นโครงสร้างข้อมูลแบบลำดับชั้นคล้ายกับเอกสาร JSON และควบรวมกิจการ นามธรรมนี้จะช่วยให้เราสามารถขยายระบบด้วยสกัดที่กำหนดเองสำหรับรูปแบบข้อมูลใหม่และจะเพิ่มการสนับสนุนสำหรับภาษามาร์กอัปความหมายในอนาคตได้โดยไม่ต้องปรับตัวเข้ากับท่อบูรณาการข้อมูล สกัดเป็นโมดูลซอฟต์แวร์ที่ประมวลผลหน้าเว็บหรือแหล่งข้อมูลเว็บถ้ามีการใช้และอาจใช้เทคนิคการเขียนโปรแกรมใด ๆ ที่พร้อมจะดึงข้อมูล จำนวนในตัวสกัด A ของเราจะอธิบายไว้ในนิกาย 5. นอกจากนี้ยังเป็นสิ่งสำคัญที่สกัดเครื่องยนต์ไม่ควรเพียง แต่จะสามารถดำเนินการจำนวนมากที่มีความหลากหลายรูปแบบ Fi le และความหมายมาร์กอัปไพเพอร์ speci Fi แต่ยังช่วยให้ผู้ใช้สร้างเนื้อหาที่จะป้อนโดยตรงเข้าสู่ระบบ ป้อนข้อมูลด้วยตนเองจะช่วยให้ผู้ใช้เพื่อสร้างรายการข้อมูลใหม่เพื่อที่จะจับข้อมูลที่อาจจะยังไม่พร้อมใช้งานออนไลน์จากเว็บไซต์ที่มีอยู่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

รูปที่ 1 แสดงแนวความคิดภาพรวมของวิธีการของเราที่มีต่อเครื่องยนต์ การรวมเนื้อหาสำหรับเว็บ เรามุ่งมั่นที่จะช่วยให้ผู้ใช้เพื่อเก็บเกี่ยวข้อมูลจากหน้าเว็บใด ๆ โดยไม่คำนึงถึงประเภทของข้อมูลจึง CS ที่เกิดขึ้นจะแสดงให้กับผู้ใช้ ด้วยเหตุผลนี้ เราจึงเสนอสถาปัตยกรรมที่สาระสังเขปประเภท C รูปแบบและรวบรวมข้อมูลจึงเข้ามาทั้งหมดข้อมูลก่อนที่จะถูกประมวลผลโดยคอมโพเนนต์เพิ่มเติมของการรวมเครื่องยนต์ จบนี้ แยกรายการข้อมูลบุคคลเปลี่ยนไปเป็นโครงสร้างข้อมูลแบบลำดับชั้น คล้ายกับ JSON เอกสารและผสาน นามธรรมนี้ช่วยให้เราสามารถขยายระบบสกัดข้อมูลที่กำหนดเองสำหรับรูปแบบใหม่และเพิ่มการสนับสนุนสำหรับภาษาแบบอรรถในอนาคตโดยไม่ต้องปรับข้อมูลการท่อ สกัดเป็นโมดูลซอฟต์แวร์กระบวนการที่หน้าเว็บหรือเว็บแหล่งข้อมูล ( ถ้ามี ) และอาจใช้เทคนิคการเขียนโปรแกรมใด ๆที่มีอยู่เพื่อสกัดข้อมูล หมายเลขของตัวสกัดได้อธิบายในนิกาย 5 . นอกจากนี้มันเป็นสิ่งสำคัญว่าเครื่องยนต์การสกัดควรไม่เพียง แต่จะสามารถดำเนินการได้มากมายหลากหลายรูปแบบและความหมายจึงเลอ มาร์กอัปกาจึงทำให้ แต่ยังช่วยให้ผู้ใช้สร้างเนื้อหาที่จะป้อนเข้าไปในระบบ รายการข้อมูลคู่มือช่วยให้ผู้ใช้เพื่อสร้างข้อมูลใหม่ รายการ เพื่อจับข้อมูลที่อาจยังสามารถออนไลน์จากเว็บไซต์ที่มีอยู่

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.