The principle of this technique is

The principle of this technique is rather simple. Let
us suppose that similarities among messages are
measurable using a measure of distance among the
characteristic vectors. To decide whether a message is
legitimate or not, we look at the class of the messages
that are closest to it. Generally, this technique does not
use a separate phase of training and the comparison
between the vectors is a real time process. This has a
time complexity of O(nl) where n is the size of the
characteristic vector and l the sample size. This can be
circumvented by using a traditional indexing methods
[13][19][35]. To adjust the risk of false classification, t/k
rule is introduced. What can be read:
If at least t messages in k neighbors of the
message m are unsolicited, then m is
unsolicited email, otherwise, it is legitimate.
We should note that the use of an indexing method in
order to reduce the time of comparisons induces an
update of the sample with a complexity O(m), where m is
the sample size. An alternative of this technique is
known as memorybased approach [2][46].
TiMBL [11] is a software package developed by ILK
Research Group that implements a collection of machine
learning algorithms. Results of the implementation of
this technique in spam filtering reported in [2] seems to
be comparable to those of bayesian classifier

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

หลักการของเทคนิคนี้คือค่อนข้างง่าย ปล่อยให้เราสมมติว่า ความคล้ายคลึงกันระหว่างข้อความเป็นสามารถวัดได้โดยใช้การวัดระยะการเวกเตอร์ลักษณะเฉพาะ การตัดสินใจว่า ข้อความถูกต้อง หรือไม่ เราดูที่ชั้นของข้อความที่อยู่ใกล้มัน โดยทั่วไป เทคนิคนี้ไม่ได้ใช้ขั้นตอนแยกต่างหากของการฝึกอบรมและการเปรียบเทียบระหว่างเวกเตอร์เป็นกระบวนการแบบเรียลไทม์ นี้มีการความซับซ้อนของ O(nl) โดยที่ n คือ ขนาดของเวลาเวกเตอร์ลักษณะเฉพาะและ l ขนาดตัวอย่าง นี้สามารถเงื่อนไขการใช้งาน โดยใช้วิธีการจัดทำดัชนีแบบดั้งเดิม[13] [19] [35] . การปรับความเสี่ยงของประเภทเท็จ k และ tกฎถูกนำมาใช้ สิ่งที่จะอ่าน:ถ้าอย่างน้อยข้อความ t ในเพื่อนบ้าน k ของการm ข้อความไม่พึงประสงค์ แล้วเป็น mอีเมลที่ไม่พึงประสงค์ อื่น ถูกต้องเราควรทราบว่า การใช้วิธีการจัดทำดัชนีในเพื่อลดเวลาในการเปรียบเทียบก่อให้เกิดการปรับปรุงตัวอย่างที่มีความซับซ้อนโดยที่ m คือ O(m)ขนาดของตัวอย่าง ทางเลือกของเทคนิคนี้คือเรียกว่าวิธี memorybased [2] [46]TiMBL [11] คือ แพ็คเกจซอฟต์แวร์ที่พัฒนา โดยบริการกลุ่มวิจัยที่ใช้คอลเลกชันของเครื่องอัลกอริธึมการเรียนรู้ ผลการดำเนินงานของดูเหมือนว่าเทคนิคนี้ในสแปมรายงานใน [2]สามารถเปรียบเทียบได้กับทฤษฎีลักษณนาม

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

หลักการของเทคนิคนี้ค่อนข้างง่าย ให้
เราคิดว่ามีความคล้ายคลึงกันในหมู่ข้อความเป็น
ที่วัดได้โดยใช้ตัวชี้วัดของระยะทางในหมู่
เวกเตอร์ลักษณะ ที่จะตัดสินใจว่าเป็นข้อความ
ที่ถูกต้องหรือไม่เรามองไปที่ระดับของข้อความ
ที่มีความใกล้เคียงกับมัน โดยทั่วไปแล้วเทคนิคนี้ไม่
ใช้ขั้นตอนที่แยกต่างหากจากการฝึกอบรมและการเปรียบเทียบ
ระหว่างเวกเตอร์เป็นกระบวนการที่เวลาจริง นี้มี
ความซับซ้อนเวลาของ O (NL) ที่ n คือขนาดของ
เวกเตอร์ลักษณะและ L ขนาดของกลุ่มตัวอย่าง นี้สามารถ
หลีกเลี่ยงได้โดยการใช้วิธีการจัดทำดัชนีดั้งเดิม
[13] [19] [35] เพื่อปรับความเสี่ยงของการจำแนกเท็จ T / K
กฎเป็นที่รู้จัก สิ่งที่สามารถอ่านได้:
ถ้าอย่างน้อยข้อความ T ในประเทศเพื่อนบ้าน k ของ
M ข้อความเป็นที่ไม่พึงประสงค์แล้ว M เป็น
อีเมลที่ไม่พึงประสงค์มิฉะนั้นจะถูกต้องตามกฎหมาย.
เราควรทราบว่าการใช้วิธีการจัดทำดัชนีใน
การสั่งซื้อเพื่อลดเวลาในการเปรียบเทียบ เจือจาง
ปรับปรุงของกลุ่มตัวอย่างที่มีความซับซ้อน O (m) m คือ
ขนาดของกลุ่มตัวอย่าง ทางเลือกของเทคนิคนี้เป็น
ที่รู้จักกันเป็นวิธีการ memorybased [2] [46].
TiMBL [11] เป็นแพคเกจซอฟต์แวร์ที่พัฒนาโดย ILK
กลุ่มงานวิจัยที่ใช้คอลเลกชันของเครื่อง
อัลกอริทึมการเรียนรู้ ผลการดำเนินงานของ
เทคนิคนี้ในการกรองสแปมรายงานใน [2] ดูเหมือนว่าจะ
สามารถเทียบเคียงกับของลักษณนาม Bayesian

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

หลักการของเทคนิคนี้คือค่อนข้างง่าย ให้เราสมมติว่ามีความคล้ายคลึงกันระหว่างข้อความสามารถใช้วัดระยะห่างระหว่างเวกเตอร์ลักษณะ การตัดสินใจว่าข้อความถูกต้องตามกฎหมายหรือไม่ เราดูที่ระดับของข้อความที่อยู่ใกล้มัน โดยทั่วไปแล้ว เทคนิคนี้ไม่ได้ใช้ขั้นตอนของการฝึกอบรมและการแยกระหว่างเวกเตอร์คือกระบวนการในเวลาจริง นี้ มีความซับซ้อนของเวลา O ( NL ) โดยที่ n คือขนาดของเวกเตอร์ลักษณะและขนาดตัวอย่าง นี้สามารถหลีกเลี่ยงโดยใช้ดัชนีวิธีแบบดั้งเดิม[ 13 ] [ 19 ] [ 35 ] การปรับความเสี่ยงของการปลอม , t / Kกฎ เป็นที่รู้จัก ที่สามารถอ่านได้ :ถ้าอย่างน้อย T K เพื่อนบ้านของข้อความจดหมายเมตร ที่ไม่พึงประสงค์ แล้ว M คืออีเมลที่ไม่พึงประสงค์ มิฉะนั้นมันถูกต้องตามกฎหมายเราต้องทราบว่ามีวิธีการในการใช้เพื่อที่จะลดเวลาของการก่อให้เกิดเป็นปรับปรุงของตัวอย่างที่มีความซับซ้อน O ( m ) โดยที่ M คือขนาดตัวอย่าง ทางเลือกของเทคนิคนี้คือที่รู้จักกันเป็นวิธีการ memorybased [ 2 ] [ 46 ]timbl [ 11 ] เป็นแพคเกจซอฟต์แวร์ที่พัฒนาโดยครั้งแรกกลุ่มงานวิจัยที่ใช้คอลเลกชันของเครื่องเรียนรู้วิธีการ ผลของการดำเนินงานของเทคนิคนี้ในการกรองสแปมรายงานใน [ 2 ] ดูเหมือนว่าจะเปรียบเทียบกับของแบบเบส์

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.