Data with String AttributesThe Stri

Data with String Attributes
The StringToWordVector filter assumes that the document text is stored in an attribute
of type String—a nominal attribute without a prespecified set of values. In the filtered
data, this is replaced by a fixed set of numeric attributes, and the class attribute
is put at the beginning, as the first attribute.
To perform document classification, first create an ARFF file with a string attribute
that holds the document’s text—declared in the header of the ARFF file using
@attribute document string, where document is the name of the attribute. A nominal
attribute is also needed to hold the document’s classification.
Exercise 17.5.1. Make an ARFF file from the labeled mini-documents in Table
17.4 and run StringToWordVector with default options on this data. How many
attributes are generated? Now change the value of the option minTermFreq to
2. What attributes are generated now?
Exercise 17.5.2. Build a J48 decision tree from the last version of the data you
generated.
Exercise 17.5.3. Classify the new documents in Table 17.5 based on the
decision tree generated from the documents in Table 17.4. To apply the same

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ข้อมูลที่ มีแอตทริบิวต์การสตริ
กรอง StringToWordVector ถือว่า ข้อความในเอกสารที่ถูกเก็บไว้ในแอตทริบิวต์
ชนิดสายอักขระ — แอตทริบิวต์ที่ระบุไม่ มีชุดของค่าที่ prespecified ในการกรอง
ข้อมูล นี้ถูกแทนที่ ด้วยชุดถาวรแอตทริบิวต์ที่เป็นตัวเลข และแอตทริบิวต์คลา
อยู่ที่เริ่มต้น เป็นแรกแอตทริบิวต์
การจัดประเภทเอกสาร สร้างแฟ้ม ARFF ที่ มีแอตทริบิวต์การสตริ
ที่เก็บข้อความของเอกสารซึ่งประกาศในหัวข้อของ ARFF แฟ้ม using
@attribute เอกสารข้อความ ชื่อของแอตทริบิวต์เอกสาร แบบว่ายอม
ยังต้องการแอททริบิวต์การจัดประเภทของเอกสารได้
17.5.1 ออกกำลังกาย ทำเป็นแฟ้ม ARFF จากป้ายมินิเอกสารตาราง
174 และรัน StringToWordVector ด้วยตัวเลือกเริ่มต้นกับข้อมูลนี้ จำนวน
สร้างแอตทริบิวต์หรือไม่ ตอนนี้ เปลี่ยนค่าของ minTermFreq เลือกการ
2 สร้างแอตทริบิวต์อะไรตอนนี้?
กาย 17.5.2 สร้าง J48 ตัดสินใจที่แผนภูมิจากข้อมูลรุ่นล่าสุดคุณ
สร้าง.
17.5.3 ออกกำลังกาย จัดประเภทเอกสารใหม่ใน 17.5 ตารางตาม
ต้นไม้การตัดสินใจที่สร้างขึ้นจากเอกสารในตาราง 17.4 ใช้เหมือนกัน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ข้อมูลที่มีคุณลักษณะตัวกรองข้อความ
stringtowordvector ถือว่าเอกสารข้อความจะถูกจัดเก็บในลักษณะของพิมพ์ชื่อแอตทริบิวต์ โดยไม่ string-a
จรชุดค่า ในกรอง
ข้อมูลนี้ถูกแทนที่โดยการตั้งค่าคงที่ของแอตทริบิวต์ตัวเลข และคลาสแอตทริบิวต์
ใส่ตอนแรก เป็นคุณสมบัติแรก
แสดงการจำแนกประเภทเอกสารแรกสร้าง arff ไฟล์ที่มีสตริงคุณลักษณะ
ที่ถือเอกสารข้อความประกาศในส่วนหัวของไฟล์โดยใช้คุณลักษณะเอกสาร arff
@ สาย ที่เอกสารเป็นชื่อของแอตทริบิวต์ . แอตทริบิวต์ชื่อ
ยังต้องการที่จะถือการจัดหมวดหมู่ของเอกสาร 17.5.1
ออกกำลังกาย . ให้ไฟล์ arff จากข้อความในเอกสารตาราง
17 มิ .4 และวิ่ง stringtowordvector ด้วยค่าเริ่มต้นตัวเลือกในข้อมูลนี้ วิธีการหลาย
คุณลักษณะที่ถูกสร้างขึ้น ? แล้วเปลี่ยนค่าของตัวเลือก mintermfreq

2 สิ่งที่คุณลักษณะที่สร้างขึ้นในตอนนี้ ?
ออกกำลังกาย 17.5.2 . สร้าง j48 ต้นไม้การตัดสินใจจากรุ่นล่าสุดของข้อมูลที่คุณ

ออกกำลังกายสร้าง 17.5.3 . แยกประเภทเอกสารใหม่ในโต๊ะ 17.5 ตาม
การตัดสินใจแบบต้นไม้ที่สร้างขึ้นจาก เอกสาร ใน ตารางสินค้า . ใช้เหมือนกันสร้างเอกสารประเภท
ถัดไปที่เราทดลองในบางหมวดหมู่เอกสาร ข้อมูลดิบเป็นข้อความ
และนี้ก่อนแปลงเป็นรูปแบบที่เหมาะสมสำหรับการเรียนรู้โดยการสร้างพจนานุกรม
ศัพท์จากเอกสารทั้งหมดในการทำคลังข้อมูลคุณลักษณะตัวเลขสำหรับแต่ละเทอมใช้ Weka
unsupervised แอตทริบิวต์ของกรอง stringtowordvector .
ยังมีคลาส คุณลักษณะ

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.