1. MotivationInformation filtering

1. Motivation
Information filtering (IF) systems are designed for
permanently scanning document streams (e. g. newsticker
or Usenet). They identify potentially important or
interesting documents for users by classifying them. For
designers of IF systems the conceptualization of user
profiles is a great challenge. For each user a profile has to
be defined. This profile determines criteria which are
utilized for user-specific classification of documents.
One approach (the explication approach) is the
definition of a formalized language which is utilized by
the user to describe his profile. This approach has been
implemented in the IF prototypes Rama [Binkley 1991],
Borges V2 [Smeaton 1996] and Sift [Yan 2000]. The
main problem with this approach is that users are often
not capable of specifying their information demand
properly. There are two main reasons for this: Firstly, it is
difficult for a user to explicate required criteria. Secondly,
the formalized language has to be powerful enough to
deal with the challenges of natural language processing
like flexions of words1, synonyms2 and polysems3. Addi-tionally, it should be powerful enough to allow complex
expressions (e. g. using Boolean operators like “or”,
“and”, “not”, etc.). On the one hand this leads to a huge
amount of time the user needs to master the language in
case it is very powerful. On the other hand the filtering
results of the IF system will be deficient if the language is
easy to use but not powerful enough.
One solution of this dilemma is the use of an adaptive
approach. The idea is to present some evaluated
documents to the IF system and to let it generate the user
profile on its own. As a side-effect the system can
improve the user profile continuously if the user himself
gives a feedback on misclassified documents. This
approach has already been implemented in NewsSIEVE
[Haneke 2001] and PI-Agent [Kuropka 2001] systems.
NewsSIEVE adapts the user profile by using evolutionary
algorithms while the PI-Agent uses neuronal networks.
Both approaches have in common that the initial
information about user profiles (= training set) are
transformed into an internal representation (e. g. neuron
weights in case of a neuronal network) which makes the
profile representation difficult to understand for users. So
the system is not able to explicate its classification rules
in a user-friendly way. This leads to the following
problems: Firstly, the user has to rely on the classification
given by the IF system without knowing how the
classification is done in detail. Secondly, in case the
user’s information demand shifts from one day to another
or the system is unable to adapt his information demand,
it is impossible for him to make reasonable corrections on
his profile. Consequently, the user has to wait until the
system has corrected his profile automatically.
Meanwhile, a lot of documents may be misclassified.
Our intention is the use of a case-based approach for
defining user profiles. This means, the user defines his
profile by presenting some evaluated documents to the
system, like in the adaptive approach. In contrast to the

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

1. แรงจูงใจ
ข้อมูลกรอง (ถ้า) ระบบถูกออกแบบมาสำหรับ
สแกนเอกสารกระแสข้อมูลอย่างถาวร (e. g. newsticker
หรือ usenet บน) พวกเขาระบุอาจสำคัญ หรือ
เอกสารสำหรับผู้ใช้ที่น่าสนใจ โดยการจัดประเภทการ สำหรับ
ออกแบบระบบถ้า conceptualization ผู้
โพรไฟล์เป็นสิ่งที่ท้าทายมากขึ้น สำหรับผู้ใช้แต่ละ โพรไฟล์ได้
กำหนด ส่วนกำหนดค่านี้กำหนดเกณฑ์ที่
ใช้สำหรับผู้ใช้เฉพาะประเภทของเอกสาร
วิธีหนึ่ง (วิธี explication) เป็นการ
นิยามของภาษาอย่างเป็นทางการที่ใช้โดย
ผู้อธิบายประวัติของเขา วิธีการนี้ได้
ในแบบตัวอย่างถ้าพระราม [Binkley 1991],
Borges V2 [Smeaton 1996] Sift [ย่าน 2000] และ ใน
ปัญหาหลัก ด้วยวิธีนี้คือผู้ใช้มัก
ไม่สามารถระบุความต้องการข้อมูล
ถูกต้อง มีเหตุผลหลักสองประการนี้: ประการแรก มันเป็น
ยากที่ผู้ใช้เกณฑ์ต้อง explicate ประการที่สอง,
ภาษาอย่างเป็นทางการยังต้องมีประสิทธิภาพพอที่จะ
กับความท้าทายของการประมวลผลภาษาธรรมชาติ
เช่น flexions words1, synonyms2 และ polysems3 Addi-tionally มันควรจะมีประสิทธิภาพเพียงพอให้ซับซ้อน
นิพจน์ (e. กรัมใช้ตัวดำเนินการแบบบูลีนเช่น "หรือ",
"และ" "ไม่" ฯลฯ .) คง นี้นำไปสู่มาก
จำนวนเวลาที่ผู้ใช้ต้องหลักภาษาใน
กรณีจึงมีประสิทธิภาพมากขึ้น ในอื่น ๆ มือกรอง
ผลลัพธ์ของระบบว่าจะขาดสารเป็น
ง่ายต่อการใช้ แต่ไม่มีประสิทธิภาพพอ
วิธีการแก้ไขปัญหาของความลำบากใจนี้คือ การใช้ของการปรับ
วิธีการ ความคิดที่จะนำเสนอบางประเมิน
เอกสารถ้าระบบ และปล่อยให้มันสร้างผู้ใช้
โปรไฟล์ของตนเอง เป็นผลข้างเคียง สามารถระบบ
ปรับปรุงส่วนกำหนดค่าผู้ใช้อย่างต่อเนื่องถ้าผู้ใช้เอง
ให้คำติชมเกี่ยวกับงานเอกสารได้ นี้
มีวิธีนำมาใช้การ NewsSIEVE
[Haneke 2001] ระบบ PI แทน [Kuropka 2001] ได้
NewsSIEVE ปรับโปรไฟล์ผู้ใช้ โดยใช้วิวัฒนาการ
อัลกอริทึมในขณะใช้ PI-ตัวแทนเครือข่าย neuronal
วิธีทั้งสองมีกันที่ต้น
มีข้อมูลเกี่ยวกับโพรไฟล์ผู้ใช้ (=ชุดฝึกอบรม)
เปลี่ยนเป็นการแสดงภายใน (e. กรัมเซลล์ประสาท
น้ำหนักในกรณีที่เครือข่าย neuronal) ซึ่งทำให้การ
แสดงส่วนกำหนดค่าที่ยากต่อการเข้าใจสำหรับผู้ใช้ ดังนั้น
ระบบจะไม่สามารถ explicate กฎการจัดประเภทของ
แบบง่าย นี้เป้าหมายต่อไป
ปัญหา: ประการแรก ผู้ใช้มีการพึ่งพาการจัดประเภท
รับระบบถ้าไม่รู้วิธี
จัดประเภทจะกระทำในรายละเอียด ประการที่สอง ในกรณี
ความต้องการข้อมูลของผู้ใช้เลื่อนจากวันหนึ่งไปยังอีก
หรือระบบไม่สามารถปรับความต้องการข้อมูลของเขา,
มันเป็นไปไม่ได้สำหรับเขาที่จะทำการแก้ไขที่เหมาะสมบน
โพรไฟล์ของเขา ดังนั้น ผู้ใช้มีการรอจนถึง
ระบบได้แก้ไขส่วนกำหนดค่าของเขาโดยอัตโนมัติ.
ในขณะเดียวกัน อาจ misclassified ของเอกสาร.
ตั้งใจจะใช้วิธีการตามกรณีสำหรับ
กำหนดโพรไฟล์ผู้ใช้ได้ ซึ่งหมายความว่า ผู้ใช้กำหนดเขา
โพรไฟล์ โดยการนำเสนอบางประเมินเอกสาร
ระบบ ชอบในวิธีเหมาะสม ในทางตรงกันข้ามกับ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

1 แรงจูงใจใน
การกรองข้อมูล (IF) ระบบถูกออกแบบมาสำหรับ
การสแกนอย่างถาวรลำธารเอกสาร (เช่น NewsTicker
หรือ Usenet) พวกเขาระบุอาจสำคัญหรือ
เอกสารที่น่าสนใจสำหรับผู้ใช้โดยการแบ่งประเภทของพวกเขา สำหรับ
นักออกแบบของระบบถ้าแนวความคิดของผู้ใช้
โปรไฟล์ที่เป็นความท้าทายที่ยิ่งใหญ่ สำหรับผู้ใช้แต่ละรายละเอียดที่มีการ
กำหนด รายละเอียดนี้จะกำหนดเกณฑ์ที่
ใช้ในการจัดหมวดหมู่การใช้งานที่เฉพาะเจาะจงของเอกสาร
เป็นวิธีหนึ่ง (วิธีการชี้แจง) คือ
ความหมายของภาษาที่เป็นทางการซึ่งจะถูกใช้โดย
ผู้ใช้เพื่ออธิบายรายละเอียดของเขา วิธีการนี้ได้รับการ
ดำเนินการใน IF ต้นแบบพระราม [Binkley 1991]
Borges V2 [Smeaton 1996] และร่อน [Yan 2000]
ปัญหาหลักด้วยวิธีนี้คือผู้ใช้มักจะ
ไม่ได้มีความสามารถในการระบุความต้องการข้อมูลของพวกเขา
อย่างถูกต้อง มีสองเหตุผลหลักนี้คือประการแรกมันเป็น
เรื่องยากสำหรับผู้ใช้เพื่ออธิบายเกณฑ์ที่จำเป็น ประการที่สอง
ภาษาที่เป็นทางการจะต้องมีประสิทธิภาพเพียงพอที่จะ
จัดการกับความท้าทายของการประมวลผลภาษาธรรมชาติ
เช่น flexions ของ words1 synonyms2 และ polysems3 Addi-เท่าเทียมก็ควรจะมีประสิทธิภาพพอที่จะให้มีความซับซ้อน
การแสดงออก (เช่นใช้ประกอบการบูลีนชอบ "หรือ"
"และ" "ไม่ได้" ฯลฯ ) บนมือข้างหนึ่งนี้นำไปสู่ขนาดใหญ่
จำนวนของเวลาที่ผู้ใช้ต้องการที่จะโทภาษาใน
กรณีที่มันจะมีประสิทธิภาพมาก ในทางตรงกันข้ามการกรอง
ผลลัพธ์ที่ได้จากระบบถ้าจะขาดถ้าภาษาที่
ใช้งานง่าย แต่ไม่ได้มีประสิทธิภาพพอที่จะ
แก้ปัญหาหนึ่งในภาวะที่กลืนไม่เข้าคายไม่ออกนี้คือการใช้การปรับ
วิธีการ ความคิดที่จะนำเสนอการประเมินบาง
เอกสารให้เป็นระบบและถ้าจะให้มันสร้างผู้ใช้
รายละเอียดในตัวของมันเอง เป็นผลข้างเคียงของระบบสามารถ
ปรับปรุงรายละเอียดของผู้ใช้อย่างต่อเนื่องหากผู้ใช้ของตัวเอง
ให้ความคิดเห็นเกี่ยวกับเอกสารที่แบ่ง ซึ่ง
วิธีการที่ได้รับการดำเนินการแล้วใน NewsSIEVE
[Haneke 2001] และ PI-Agent [Kuropka 2001] ระบบ
NewsSIEVE ปรับรายละเอียดของผู้ใช้โดยใช้วิวัฒนาการ
ขั้นตอนวิธีในขณะที่ PI-Agent ใช้เครือข่ายเส้นประสาท
ทั้งสองวิธีได้เหมือนกันว่าเริ่มต้น
ข้อมูลเกี่ยวกับ โปรไฟล์ผู้ใช้ (= ชุดการฝึกอบรม) จะถูก
เปลี่ยนเป็นแสดงภายใน (เช่นเซลล์ประสาท
น้ำหนักในกรณีของเครือข่ายเส้นประสาท) ซึ่งจะทำให้
การแสดงรายละเอียดยากที่จะเข้าใจสำหรับผู้ใช้ ดังนั้น
ระบบไม่สามารถที่จะอธิบายกฎการจัดหมวดหมู่ของตน
ในทางที่ใช้งานง่าย นี้นำไปสู่การต่อไปนี้
ปัญหาประการแรกผู้ใช้มีการพึ่งพาการจัดหมวดหมู่
ที่กำหนดโดยระบบ IF โดยไม่ทราบวิธี
การจัดหมวดหมู่จะทำในรายละเอียด ประการที่สองในกรณีที่
การเปลี่ยนแปลงความต้องการข้อมูลของผู้ใช้จากวันหนึ่งไปยังอีก
หรือระบบไม่สามารถปรับตัวเข้ากับความต้องการข้อมูลของเขา
มันเป็นไปไม่ได้สำหรับเขาที่จะทำให้การแก้ไขที่เหมาะสมใน
โปรไฟล์ของเขา ดังนั้นผู้ใช้จะต้องรอจนกว่าจะ
มีการแก้ไขระบบโปรไฟล์ของเขาโดยอัตโนมัติ
ในขณะที่จำนวนมากของเอกสารที่อาจจะแบ่ง
ความตั้งใจของเราคือการใช้วิธีการกรณีที่ใช้สำหรับการ
กำหนดโปรไฟล์ผู้ใช้ ซึ่งหมายความว่าผู้ใช้กำหนดของเขา
โดยนำเสนอรายละเอียดเอกสารการประเมินผลบางอย่างเพื่อให้
ระบบเช่นในแนวทางการปรับตัว ในทางตรงกันข้ามกับ

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

1 . แรงจูงใจ
ข้อมูลกรอง ( ถ้า ) ระบบถูกออกแบบมาเพื่อการสแกนเอกสารข้อมูล
อย่างถาวร ( เช่น newsticker
หรือ Usenet ) พวกเขาระบุอาจสำคัญ หรือเอกสารที่น่าสนใจสำหรับผู้ใช้
โดยแบ่งประเภทของพวกเขา สำหรับ
นักออกแบบของ ถ้าระบบการโปรไฟล์ผู้ใช้
เป็นความท้าทายที่ยิ่งใหญ่ สำหรับผู้ใช้แต่ละโปรไฟล์ได้

จะกำหนดโปรไฟล์นี้จะกำหนดเกณฑ์ที่ใช้ในการจำแนกผู้ใช้เฉพาะ

ของเอกสาร วิธีการหนึ่ง ( การแจกแจงวิธีการ )
ความหมายของภาษาเป็นทางการซึ่งถูกใช้ โดย
ผู้ใช้อธิบายโปรไฟล์ของเขา วิธีการนี้ได้ถูกใช้ในต้นแบบ
ถ้าพระราม [ ตัวแทน 1991 ] ,
Borges v2 [ 1996 ] และร่อนยันสมีเติ้น [ 2000 ]
ปัญหาด้วยวิธีนี้คือ ผู้ใช้มักจะ
ไม่สามารถระบุความต้องการของพวกเขาข้อมูล
อย่างถูกต้อง มีสองเหตุผลหลักนี้คือ มันเป็น
ยากสำหรับผู้ใช้เพื่ออธิบายเป็นเกณฑ์ ประการที่สอง
เป็นทางการภาษามีอำนาจพอที่จะจัดการกับความท้าทายของธรรมชาติ

ชอบ flexions การประมวลผลภาษาของ words1 synonyms2 polysems3 , และ .addi tionally มันควรจะมีประสิทธิภาพเพียงพอที่จะอนุญาตให้นิพจน์ที่ซับซ้อน ( เช่นการใช้ผู้ประกอบการบูลีน

" ชอบ " หรือ " และ " , " ไม่ " , ฯลฯ ) ในมือข้างหนึ่งทำให้เกิดเป็นจํานวนมาก
ของเวลาที่ผู้ใช้ต้องการที่จะโทภาษาใน
กรณีมันมีพลังมาก บนมืออื่น ๆการกรอง
ผลว่าระบบจะขาดถ้าภาษาที่ใช้งานง่ายแต่ไม่ได้

ที่มีประสิทธิภาพเพียงพอทางออกหนึ่งของปัญหานี้คือ การใช้วิธีการปรับ

ความคิดคือ ปัจจุบันบางประเมิน
เอกสารถ้าระบบและเพื่อให้มันสร้างผู้ใช้
โปรไฟล์ของตัวเอง เป็นระบบที่สามารถ ผลข้างเคียง
ปรับปรุงโปรไฟล์ผู้ใช้อย่างต่อเนื่องหากผู้ใช้เอง
misclassified ให้ข้อเสนอแนะในเอกสาร วิธีการนี้ได้ถูกนำไปใช้ใน newssieve

[ 2001 ] แฮนิกและตัวแทน [ PI kuropka 2001 ] ระบบ .
newssieve ปรับรายละเอียดของผู้ใช้ โดยการใช้ขั้นตอนวิธีเชิงวิวัฒนาการ
ในขณะที่และตัวแทนการใช้เครือข่ายด .
ทั้งสองวิธีมีเหมือนกันว่าเริ่มต้น
ข้อมูลเกี่ยวกับโปรไฟล์ผู้ใช้ ( ชุดฝึก )
แปลงเป็นรูปแบบภายใน ( เช่น เซลล์ประสาท
ยกน้ําหนัก ในกรณีของเครือข่ายของเซลล์ประสาท ) ซึ่งทำให้
การแสดงข้อมูลที่เข้าใจยากสำหรับผู้ใช้ ดังนั้น
ระบบไม่สามารถอธิบายของกฎการจำแนก
ในวิธีที่ง่าย นี้นำไปสู่ปัญหาต่อไปนี้
: ประการแรก ผู้ใช้มีการพึ่งพาการ
ให้ โดยหากระบบ โดยไม่รู้ว่า
หมวดหมู่เสร็จในรายละเอียด ประการที่สองในกรณีที่
ผู้ใช้ข้อมูลความต้องการเปลี่ยนแปลงจากวันหนึ่งไปยังอีก
หรือระบบไม่สามารถปรับข้อมูลความต้องการของเขา
มันเป็นไปไม่ได้สำหรับเขาที่จะทำให้การแก้ไขที่เหมาะสมบน
โปรไฟล์ของเขา ดังนั้น ผู้ใช้ต้องรอจนกว่าระบบมีการแก้ไขโปรไฟล์ของเขาโดยอัตโนมัติ
.
ส่วนมากของเอกสารที่อาจจะ misclassified .
ความตั้งใจของเราคือการใช้เป็นกรณีศึกษาแนวทาง
กำหนดโปรไฟล์ผู้ใช้ ซึ่งหมายความว่าผู้ใช้กำหนดของเขา
รายละเอียด ด้วยการนำเสนอบางประเมินเอกสาร
ระบบเหมือนในแนวทางการปรับตัว ในทางตรงกันข้ามกับ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.