Standardizes all numeric attributes in the given dataset to have zero  การแปล - Standardizes all numeric attributes in the given dataset to have zero  ไทย วิธีการพูด

Standardizes all numeric attributes

Standardizes all numeric attributes in the given dataset to have zero mean and unit variance (apart from the class attribute, if set).

OPTIONS
ignoreClass -- The class index will be unset temporarily before the filter is applied.

Perform each of the following data preparation tasks:
a. Use smoothing by bin means to smooth the values of the Age attribute. Use a bin depth of 4.
b. Use min-max normalization to transform the values of the Income attribute onto the range [0.0-1.0].
c. Use z-score normalization to standardize the values of the Rentals attribute.
d. Discretize the (original) Income attribute based on the following categories: High = 60K+; Mid = 25K-59K; Low = less than $25K.
e. Convert the original data (not the results of parts a-d) into the standard spreadsheet format (note that this requires that you create, for every categorical attribute, additional attributes corresponding to values of that categorical attribute; numerical attributes in the original data remain unchanged).
f. Using the standardized data set (from part e), perform basic correlation analysis among the attributes. Discuss your results by indicating any strong correlations (positive or negative) among pairs of attributes. You need to construct a complete Correlation Matrix (Please read the document Basic Correlation Analysis for more detail and an example). Can you observe any "significant" patterns among groups of two or more variables? Explain.
g. Perform a cross-tabulation of the two "gender" variables versus the three "genre" variables. Show this as a 2 x 3 table with entries representing the total counts. Then, use a graph or chart that provides the best visualization of the relationships between these sets of variables. See Slide 41 in Lecture 2 for an example. Also review Chapter 4 of Berry and Linoff. Can you draw any significant conclusions?
h. Select all "good" customers with a high value for the Rentals attribute ( a "good customer is defined as one with a Rentals value of greater than or equal to 30). Then, create a summary (e.g., using means, medians, and/or other statistics) of the selected data with respect to all other attributes. Can you observe any significant patterns that characterize this segment of customers? Explain. Note: to know whether your observed patterns in the target group are significant, you need to compare them with the general population using the same metrics.
i. Suppose that because of the high profit margin, the store would like to increase the sales of incidentals. Based on your observations in previous parts discuss how this could be accomplished (e.g., should customers with specific characteristics be targeted? Should certain types of movies be preferred? Etc.). Explain your answer based on your analysis of the data.
j. Use WEKA to perform the following tasks on the original data set (use the Comma Separated version of the above data set: Video_Store.csv). Load the data into WEKA Explorer (the Preprocessing module). Remove the Customer ID attribute. Review basic statistics for different attributes by clicking on the name of each one in "attribute" panel. Next, use the unsupervised attribute "Discretize" filter to discretize the Age attribute. Finally, use the unsupervised attribute "Normalize" filter to convert all of the remaining numerical attribute into [0,1] scale. Save the resulting data set into an ARFF formatted file and submit with your answers for the above questions.

Note: You can give the final results of parts (a) through (d) as a single table which includes the original data and has an added column for each of the parts (a) through (d). The results of part (e) should be a separate table. For the correlation analysis (part f) give your correlation matrix (rows and columns of the matrix are the attributes, and entries would represent correlation value for a pair of attributes (e.g., "Income" versus "Age"). Your analyses for various parts can be added to the same spreadsheet file, or it could be included in another document (e.g., an MS Word file). Please create a single ZIP archive for all your documents and submit via Facebook.


0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
Standardizes แอตทริบิวต์ตัวเลขทั้งหมดในชุดข้อมูลที่กำหนดให้มีผลต่างค่าเฉลี่ยและหน่วยเป็นศูนย์ (จากแอตทริบิวต์คลา ถ้าตั้ง)

ตัว
ignoreClass - ดัชนีชั้นจะยกเลิกการตั้งชั่วคราวก่อนที่ตัวกรองจะใช้

ทำงานเตรียมข้อมูลต่อไปนี้:
a. ใช้ราบเรียบ โดยช่องหมายถึง ให้เรียบค่าของแอททริบิวต์อายุ ใช้ความลึกของช่องเก็บของ 4.
b ใช้ฟื้นฟูต่ำสุดสูงสุดในการแปลงค่าของแอตทริบิวต์เงินลงในช่วง [0.0-1.0] .
c. ฟื้นฟูคะแนน z ใช้เพื่อกำหนดค่าของแอททริบิวต์เช่ามาตรฐาน
d. Discretize แอตทริบิวต์รายได้ (ต้นฉบับ) ที่ตามประเภทต่อไปนี้: สูง = 60K กลาง = 25K - 59K ต่ำ =น้อยกว่า $25 คุณ
e แปลงข้อมูลต้นฉบับ (ไม่ผลลัพธ์ของชิ้นส่วน a-d) เป็นรูปแบบกระดาษมาตรฐาน (โปรดสังเกตว่าการที่คุณสร้าง สำหรับแอททริบิวต์ทุกแตก เพิ่มเติมแอตทริบิวต์ที่สอดคล้องกับค่าของแอตทริบิวต์ที่แตก เลขแอตทริบิวต์ในข้อมูลต้นฉบับยังคงอยู่ไม่เปลี่ยนแปลง) .
เอฟใช้ชุดข้อมูลมาตรฐาน (จากส่วน e), ทำการวิเคราะห์พื้นฐานความสัมพันธ์ระหว่างแอททริบิวต์ อภิปรายผลของคุณ โดยการบ่งชี้ใด ๆ แรงสัมพันธ์ (ค่าบวก หรือค่าลบ) ระหว่างคู่ของแอตทริบิวต์ คุณต้องสร้างเมทริกซ์สหสัมพันธ์สมบูรณ์ (กรุณาอ่านเอกสารพื้นฐานการวิเคราะห์ความสัมพันธ์สำหรับรายละเอียดเพิ่มเติมและตัวอย่าง) คุณสามารถสังเกตรูปแบบใด ๆ "สำคัญ" ระหว่างกลุ่มของตัวแปรสองตัว หรือมากกว่า อธิบาย
g ทำข้าม tabulation แปร "เพศ" ที่ 2 เทียบกับตัวแปรสาม "ประเภท" แสดงนี้เป็นตาราง 2 x 3 มีรายการแสดงจำนวนรวม แล้ว ใช้กราฟหรือแผนภูมิที่ให้ภาพแสดงความสัมพันธ์ระหว่างชุดของตัวแปรเหล่านี้ ดูภาพนิ่ง 41 ในการบรรยาย 2 สำหรับตัวอย่าง นอกจากนี้ยัง ตรวจสอบบทที่ 4 เบอร์รี่และ Linoff คุณสามารถวาดบทสรุปสำคัญใด ๆ ?
h. เลือกลูกค้า "ดี" ทั้งหมด มีค่าสูงสำหรับเช่ากำหนด (เป็น "ลูกค้าถูกกำหนดเป็นหนึ่งกับค่าเช่าของที่มากกว่า หรือเท่ากับ 30) สร้างสรุปแล้ว (เช่น การใช้พาหนะ medians และ/หรือสถิติอื่น ๆ) ของข้อมูลที่เลือกกับแอททริบิวต์อื่น ๆ คุณสามารถสังเกตรูปแบบใด ๆ อย่างมีนัยสำคัญที่เซ็กเมนต์นี้ของลูกค้า อธิบาย หมายเหตุ: เมื่อต้องการทราบว่า รูปแบบของคุณสังเกตในกลุ่มเป้าหมายสำคัญ คุณจำเป็นต้องเปรียบเทียบกับประชากรทั่วไปที่ใช้แบบเดียวกันวัด
i. สมมติว่า เนื่องจากอัตรากำไรสูง ร้านค้าต้องการเพิ่มยอดขายของเช็คอิน ตามสังเกตการณ์ในส่วนก่อนหน้านี้กล่าวถึงวิธีนี้สามารถมาได้ (เช่น ควรลูกค้าที่ มีลักษณะเฉพาะมีการกำหนดเป้าหมายหรือไม่ ควรต้องบางชนิดของภาพยนตร์ ฯลฯ) อธิบายคำตอบของคุณตามการวิเคราะห์ของข้อมูล
เจ WEKA ที่ใช้เพื่อทำงานต่อไปนี้บนชุดข้อมูลเดิม (ใช้รุ่นคั่นด้วยเครื่องหมายจุลภาคของชุดข้อมูลด้านบน: Video_Storecsv) โหลดข้อมูลเข้า WEKA Explorer (Preprocessing โม) ลบแอททริบิวต์รหัสลูกค้า ทบทวนสถิติเบื้องต้นสำหรับแอตทริบิวต์ที่แตกต่างกัน โดยคลิกที่ชื่อของแต่ละคนในแผง "แอตทริบิวต์" ใช้ตัวกรองแอตทริบิวต์ unsupervised "Discretize" การ discretize แอตทริบิวต์อายุ สุดท้าย ใช้แอตทริบิวต์ unsupervised "Normalize" กรองแปลงของแอตทริบิวต์ที่เป็นตัวเลขที่เหลือทั้งหมดเป็นมาตราส่วน [0,1] บันทึกชุดข้อมูลผลลัพธ์ไปยังแฟ้มรูปแบบ ARFF และส่งพร้อมคำตอบของคุณสำหรับการกล่าวคำถาม

หมายเหตุ: คุณสามารถให้ผลลัพธ์ขั้นสุดท้ายส่วน (ก) ถึง (d) เป็นตารางเดียวซึ่งมีข้อมูลต้นฉบับ และมีการเพิ่มคอลัมน์สำหรับแต่ละส่วน (ก) ถึง (d) ผลลัพธ์ของส่วน (e) จะเป็นตารางแยกต่างหาก สำหรับความสัมพันธ์ที่ วิเคราะห์ (ส่วน f) ให้ของเมตริกซ์สหสัมพันธ์ (แถวและคอลัมน์ของเมทริกซ์มีแอตทริบิวต์ และรายการจะแสดงค่าความสัมพันธ์คู่ของแอตทริบิวต์ (เช่น, "รายได้" กับ "อายุ") การวิเคราะห์ในส่วนต่าง ๆ สามารถเพิ่มลงในแฟ้มกระดาษคำนวณแบบเดียวกัน หรืออาจจะรวมอยู่ในเอกสารอื่น (เช่น MS Word แฟ้ม) กรุณาสร้างเก็บถาวรแบบ ZIP เดียวสำหรับเอกสารของคุณ และส่งผ่าน Facebook


การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
Standardizes all numeric attributes in the given dataset to have zero mean and unit variance (apart from the class attribute, if set).

OPTIONS
ignoreClass -- The class index will be unset temporarily before the filter is applied.

Perform each of the following data preparation tasks:
a. Use smoothing by bin means to smooth the values of the Age attribute. Use a bin depth of 4.
b. Use min-max normalization to transform the values of the Income attribute onto the range [0.0-1.0].
c. Use z-score normalization to standardize the values of the Rentals attribute.
d. Discretize the (original) Income attribute based on the following categories: High = 60K+; Mid = 25K-59K; Low = less than $25K.
e. Convert the original data (not the results of parts a-d) into the standard spreadsheet format (note that this requires that you create, for every categorical attribute, additional attributes corresponding to values of that categorical attribute; numerical attributes in the original data remain unchanged).
f. Using the standardized data set (from part e), perform basic correlation analysis among the attributes. Discuss your results by indicating any strong correlations (positive or negative) among pairs of attributes. You need to construct a complete Correlation Matrix (Please read the document Basic Correlation Analysis for more detail and an example). Can you observe any "significant" patterns among groups of two or more variables? Explain.
g. Perform a cross-tabulation of the two "gender" variables versus the three "genre" variables. Show this as a 2 x 3 table with entries representing the total counts. Then, use a graph or chart that provides the best visualization of the relationships between these sets of variables. See Slide 41 in Lecture 2 for an example. Also review Chapter 4 of Berry and Linoff. Can you draw any significant conclusions?
h. Select all "good" customers with a high value for the Rentals attribute ( a "good customer is defined as one with a Rentals value of greater than or equal to 30). Then, create a summary (e.g., using means, medians, and/or other statistics) of the selected data with respect to all other attributes. Can you observe any significant patterns that characterize this segment of customers? Explain. Note: to know whether your observed patterns in the target group are significant, you need to compare them with the general population using the same metrics.
i. Suppose that because of the high profit margin, the store would like to increase the sales of incidentals. Based on your observations in previous parts discuss how this could be accomplished (e.g., should customers with specific characteristics be targeted? Should certain types of movies be preferred? Etc.). Explain your answer based on your analysis of the data.
j. Use WEKA to perform the following tasks on the original data set (use the Comma Separated version of the above data set: Video_Store.csv). Load the data into WEKA Explorer (the Preprocessing module). Remove the Customer ID attribute. Review basic statistics for different attributes by clicking on the name of each one in "attribute" panel. Next, use the unsupervised attribute "Discretize" filter to discretize the Age attribute. Finally, use the unsupervised attribute "Normalize" filter to convert all of the remaining numerical attribute into [0,1] scale. Save the resulting data set into an ARFF formatted file and submit with your answers for the above questions.

Note: You can give the final results of parts (a) through (d) as a single table which includes the original data and has an added column for each of the parts (a) through (d). The results of part (e) should be a separate table. For the correlation analysis (part f) give your correlation matrix (rows and columns of the matrix are the attributes, and entries would represent correlation value for a pair of attributes (e.g., "Income" versus "Age"). Your analyses for various parts can be added to the same spreadsheet file, or it could be included in another document (e.g., an MS Word file). Please create a single ZIP archive for all your documents and submit via Facebook.


การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
สร้างมาตรฐานคุณลักษณะตัวเลขทั้งหมดที่ได้รับในวันที่มีศูนย์และหน่วยความแปรปรวน ( นอกเหนือจากเรียน คุณลักษณะ ถ้าตั้งค่าตัวเลือก )


ignoreclass -- ชั้นเรียนดัชนีจะล้างกรองชั่วคราวก่อนใช้

แสดงแต่ละต่อไปนี้การเตรียมข้อมูลงาน :
. ใช้เรียบโดยบินหมายถึง ค่าของแอตทริบิวต์อายุเรียบ ใช้บินลึก 4 .
Bใช้ Min Max บรรทัดฐานที่จะเปลี่ยนค่าของแอตทริบิวต์รายได้บนช่วง [ 0.0-1.0 ] .
c ใช้คะแนนบรรทัดฐานมาตรฐานค่าเช่าคุณลักษณะ discretize
d ( เดิม ) ของรายได้ตามประเภทต่อไปนี้ : 60K สูงกลางต่ำ 25k-59k = = ; = น้อยกว่า $ 25k .
E .แปลงข้อมูลเดิม ( ไม่ใช่ผลของชิ้นส่วน A-D ) เป็นรูปแบบตารางมาตรฐาน ( หมายเหตุนี้ต้องการให้คุณสร้างทุกจำแนกประเภท คุณลักษณะ คุณลักษณะเพิ่มเติมที่สอดคล้องกับค่าของแอตทริบิวต์ที่เด็ดขาด ; ตัวเลขแอตทริบิวต์ในข้อมูลเดิมไม่เปลี่ยนแปลง ) .
F . ใช้ชุดข้อมูลมาตรฐาน ( ส่วนหนึ่งจาก E )วิเคราะห์ความสัมพันธ์พื้นฐานระหว่างแอตทริบิวต์ อภิปรายผล โดยแสดงความสัมพันธ์ที่แข็งแกร่ง ( บวกหรือลบ ) ระหว่างคู่ของแอตทริบิวต์ คุณต้องการที่จะสร้างเมทริกซ์สหสัมพันธ์ที่สมบูรณ์ ( โปรดอ่านเอกสารพื้นฐาน การวิเคราะห์สหสัมพันธ์สำหรับรายละเอียดเพิ่มเติมและตัวอย่าง ) คุณสามารถ สังเกตใด ๆ " อย่างมีนัยสำคัญ " รูปแบบในกลุ่มของตัวแปรสองตัวหรือมากกว่า ? อธิบาย
Gแสดงตารางไขว้สอง " เพศ " และ " ประเภท " ตัวแปร 3 ตัวแปร การแสดงนี้เป็น 2 x 3 ตารางที่มีรายการแทน นับรวม แล้วใช้กราฟหรือแผนภูมิที่ให้ภาพที่ดีที่สุดของความสัมพันธ์ระหว่างชุดของตัวแปร ดูภาพนิ่ง 41 ในการบรรยาย 2 ตัวอย่าง ทบทวนบทที่ 4 ของ เบอร์รี่ และ linoff .คุณสามารถวาดข้อสรุปใด ๆที่สำคัญ ?
H . เลือกทั้งหมด " ลูกค้า " ด้วยมูลค่าสูงสำหรับเช่าแอททริบิวต์ ( ลูกค้าดี " หมายถึงหนึ่งกับเช่าค่ามากกว่าหรือเท่ากับ 30 ) แล้วสร้างบทสรุป ( เช่น ใช้หมายความว่า มีเดีย และ / หรือสถิติอื่น ๆ ) ของข้อมูลที่เลือกเกี่ยวกับคุณลักษณะอื่น ๆทั้งหมดคุณสามารถ สังเกตใด ๆที่สำคัญรูปแบบลักษณะของลูกค้ากลุ่มนี้ อธิบาย หมายเหตุ : เพื่อให้ทราบว่า คุณสังเกตรูปแบบในกลุ่มเป้าหมายที่สำคัญ คุณต้องเปรียบเทียบกับประชากรทั่วไปที่ใช้วัดเดียวกัน .
ฉันสมมติว่าเพราะมีกำไรสูง ร้าน ต้องการเพิ่มยอดขายของโอกาสนี้จากการสังเกตของคุณในส่วนก่อนหน้านี้กล่าวถึงวิธีนี้สำเร็จได้ เช่น หากลูกค้ามีลักษณะเฉพาะเป็นเหยื่อเหรอ ? ควรบางชนิดของหนังต้อง ? ฯลฯ ) อธิบายคำตอบของคุณบนพื้นฐานของการวิเคราะห์ข้อมูล .
J ใช้ Weka ปฏิบัติงานตามต้นฉบับชุดข้อมูล ( ใช้เครื่องหมายจุลภาคคั่นระหว่างรุ่นของชุดข้อมูลข้างต้น : video_store .CSV ) โหลดข้อมูลลงใน Weka Explorer ( Preprocessing โมดูล ) เอารหัสลูกค้าคุณลักษณะ ทบทวนสถิติพื้นฐานสำหรับคุณลักษณะต่าง ๆโดยคลิกที่ชื่อของแต่ละคน ในเรื่อง " แอตทริบิวต์ " แผง ถัดไปใช้แอตทริบิวต์ " discretize unsupervised " ตัวกรอง discretize อายุคุณลักษณะ ในที่สุดใช้ unsupervised แอตทริบิวต์ " ปกติ " ตัวกรองการแปลงทั้งหมดของแอตทริบิวต์ในเหลือตัวเลข [ 0.1 ] ขนาด บันทึกผลเป็นแฟ้มจัดรูปแบบชุดข้อมูล arff และส่งกับคำตอบของคุณสำหรับคำถามข้างต้น โปรดทราบ

:คุณสามารถให้ ผลลัพธ์สุดท้ายของชิ้นส่วน ( ) ผ่าน ( D ) เป็นตารางเดียวซึ่งประกอบด้วยข้อมูลเดิม และมีการเพิ่มคอลัมน์สำหรับแต่ละส่วน ( ) ผ่าน ( D ) ผลของส่วน ( E ) ควรจะแยกโต๊ะ สำหรับการวิเคราะห์สหสัมพันธ์ ( Correlation Matrix ภาค F ) ให้คุณ ( แถวและคอลัมน์ของเมตริกซ์เป็นลักษณะและรายการจะแสดงถึงค่าความสัมพันธ์สำหรับคู่ของแอตทริบิวต์ ( เช่น " รายได้ " และ " อายุ " ) การวิเคราะห์ของคุณสำหรับส่วนต่าง ๆ สามารถเพิ่มไฟล์สเปรดชีตเดียวกัน หรืออาจจะรวมอยู่ในเอกสารอื่น เช่น เป็น MS Word ไฟล์ ) กรุณาสร้างคลังซิปเดียวสำหรับเอกสารทั้งหมดของคุณและส่งผ่าน

Facebook
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: