Validity[edit]Validity refers to how well a tool measures what it inte การแปล - Validity[edit]Validity refers to how well a tool measures what it inte ไทย วิธีการพูด

Validity[edit]Validity refers to ho

Validity[edit]
Validity refers to how well a tool measures what it intends to measure. With each user rating a product only once, for example in a category from 1 to 10, there is no means for evaluating internal reliability using an index such as Cronbach's alpha. It is therefore impossible to evaluate the validity of the ratings as measures of viewer perceptions. Establishing validity would require establishing both reliability and accuracy (i.e. that the ratings represent what they are supposed to represent).The degree of validity of an instrument is determined through the application of logic/or statistical procedures." A measurement procedure is valid to the degree that if measures what it proposes to measure"

Another fundamental issue is that online ratings usually involve convenience sampling much like television polls, i.e. they represent only the opinions of those inclined to submit ratings.

Validity is concerned with different aspects of the measurement process.Each of these types uses logic, statistical verification or both to determine the degree of validity and has special value under certain conditions. Types of validity include content validity, predictive validity, and construct validity.

Sampling[edit]
Sampling errors can lead to results which have a specific bias, or are only relevant to a specific subgroup. Consider this example: suppose that a film only appeals to a specialist audience—90% of them are devotees of this genre, and only 10% are people with a general interest in movies. Assume the film is very popular among the audience that views it, and that only those who feel most strongly about the film are inclined to rate the film online; hence the raters are all drawn from the devotees. This combination may lead to very high ratings of the film, which do not generalize beyond the people who actually see the film (or possibly even beyond those who actually rate it).

Qualitative description[edit]
Qualitative description of categories improve the usefulness of a rating scale. For example, if only the points 1-10 are given without description, some people may select 10 rarely, whereas others may select the category often. If, instead, "10" is described as "near flawless", the category is more likely to mean the same thing to different people. This applies to all categories, not just the extreme points.

The above issues are compounded, when aggregated statistics such as averages are used for lists and rankings of products. User ratings are at best ordinal categorizations. While it is not uncommon to calculate averages or means for such data, doing so cannot be justified because in calculating averages, equal intervals are required to represent the same difference between levels of perceived quality. The key issues with aggregate data based on the kinds of rating scales commonly used online are as follow:

Averages should not be calculated for data of the kind collected.
It is usually impossible to evaluate the reliability or validity of user ratings.
Products are not compared with respect to explicit, let alone common[clarification needed], criteria.
Only users inclined to submit a rating for a product do so.
Data are not usually published in a form that permits evaluation of the product ratings.
More developed methodologies include Choice Modelling or Maximum Difference methods, the latter being related to the Rasch model due to the connection between Thurstone's law of comparative judgement[clarification needed] and the Rasch model.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
มีผลบังคับใช้ [แก้ไข]มีผลบังคับใช้ถึงวิธีการที่ดีเครื่องมือวัดจะมีวัด มีผู้จัดอันดับผลิตภัณฑ์เดียวกัน เช่นในประเภท 1 10 มีไม่หมายถึงการประเมินความน่าเชื่อถือภายในที่ใช้ดัชนีเช่นอัลฟาของ Cronbach จึงไม่สามารถประเมินถูกจัดอันดับเป็นการวัดภาพลักษณ์คอร์รัปชันแสดง กำหนดมีผลบังคับใช้จะต้องสร้างความน่าเชื่อถือและความถูกต้อง (เช่นว่า การจัดอันดับแสดงถึงสิ่งที่พวกเขาควรจะแสดง) ระดับของการมีผลบังคับใช้ของถูกกำหนด โดยใช้ตรรกะ / หรือวิธีการทางสถิติ " ขั้นตอนการประเมินถูกต้องยังมีมาตรการว่าถ้าอะไรที่มันเสนอวัด "พื้นฐานปัญหาอื่นคือ ว่า ออนไลน์อันดับมักจะเกี่ยวข้องกับความสะดวกสบายมากเช่นทีวีสำรวจสุ่มตัวอย่าง เช่นเขาแสดงความเห็นของผู้ที่จะส่งประเมินมีผลบังคับใช้เกี่ยวข้องกับด้านต่าง ๆ ของการประเมิน แต่ละชนิดเหล่านี้ใช้ตรรกะ การตรวจสอบทางสถิติ หรือทั้งสองอย่างเพื่อกำหนดระดับของการมีผลบังคับใช้ และมีค่าพิเศษภายใต้เงื่อนไขบางประการ ชนิดที่มีผลบังคับใช้ได้แก่เนื้อหามีผลบังคับใช้ ใช้งาน และสร้างตั้งแต่สุ่มตัวอย่าง [แก้ไข]ข้อผิดพลาดในการสุ่มตัวอย่างอาจทำให้ผลลัพธ์ที่มีความโน้มเอียงบาง หรือมีเฉพาะที่เกี่ยวข้องกับกลุ่มย่อยเฉพาะ พิจารณาตัวอย่างนี้: สมมติว่า ภาพยนตร์เท่านั้นที่ดึงดูดให้ผู้ชมผู้เชี่ยวชาญซึ่ง 90% ของศาสนิกชนของประเภทนี้ และเพียง 10% บุคคลสนใจทั่วไปในภาพยนตร์ สมมติว่า ฟิล์มเป็นที่นิยมมากในหมู่ผู้ชมที่ดู และเฉพาะผู้ที่รู้สึกสุดอย่างยิ่งเกี่ยวกับฟิล์มอยากอันดับภาพยนตร์ออนไลน์ ดังนั้น raters ที่อยู่ทั้งหมดออกจากการเลือกสรรค์ ชุดนี้อาจทำการจัดอันดับสูงของฟิล์ม ที่ไม่ทั่วไปนอกเหนือจากคนที่ดูภาพยนตร์จริง (หรือแม้แต่อาจจะเกินที่จริง อัตรา)คำอธิบายเชิงคุณภาพ [แก้ไข]คำอธิบายเชิงคุณภาพประเภทปรับปรุงประโยชน์ของมาตราจัดอันดับ ตัวอย่าง ถ้าเพียงจุด 1-10 ได้ โดยไม่มีคำอธิบาย บางคนอาจเลือก 10 ไม่ค่อย ในขณะที่คนอื่น ๆ อาจเลือกประเภทมักจะ ถ้า แทน "10" จะอธิบายว่า "ใกล้ซุก" ประเภทมีแนวโน้มที่จะหมายถึง สิ่งเดียวกันกับคนอื่น นี้ใช้ได้กับทุกประเภท จุดมากก็ปัญหาข้างต้นได้เพิ่ม รวมสถิติเช่นค่าเฉลี่ยจะใช้สำหรับรายการและการจัดอันดับของผลิตภัณฑ์ จัดอันดับผู้ใช้จะจัดประเภทเลขลำดับดีที่สุด ในขณะที่ไม่ใช่การคำนวณค่าเฉลี่ยหรือในข้อมูลดังกล่าว ทำให้ไม่ได้รับการพิสูจน์เนื่องจากในการคำนวณค่าเฉลี่ย ช่วงเท่ากันจะต้องแสดงถึงความแตกต่างกันระหว่างระดับการรับรู้คุณภาพการ ปัญหาหลักกับข้อมูลตามชนิดของเครื่องชั่งที่ใช้บ่อยออนไลน์จะเป็นการจัดอันดับตาม:ไม่ควรคำนวณค่าเฉลี่ยสำหรับข้อมูลชนิดเก็บรวบรวมจึงมักไม่สามารถประเมินความน่าเชื่อถือหรือมีผลบังคับใช้ของการจัดอันดับของผู้ใช้ผลิตภัณฑ์จะไม่เปรียบเทียบ ด้วยความเคารพให้ชัดเจน นับ ประสาทั่วไป [ชี้แจงจำเป็น], เงื่อนไขเฉพาะผู้ใช้ที่จะส่งการจัดอันดับสำหรับผลิตภัณฑ์ดังกล่าวมักจะไม่มีประกาศข้อมูลในแบบฟอร์มที่อนุญาตให้มีการประเมินผลการจัดอันดับผลิตภัณฑ์พัฒนามากขึ้นวิธีการรวมถึงวิธีการสร้างแบบจำลองทางเลือกหรือความแตกต่างสูงสุด การหลังการเกี่ยวข้องกับแบบ Rasch เนื่องจากการเชื่อมต่อระหว่างกฎหมายของ Thurstone ตัดสินเปรียบเทียบ [ชี้แจงที่จำเป็น] และรุ่น Rasch
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!
ตั้งแต่วันที่ [แก้ไข]
ตั้งแต่วันที่หมายถึงวิธีการที่ดีเป็นเครื่องมือวัดสิ่งที่มันตั้งใจที่จะวัด กับผู้ใช้แต่ละคนจัดอันดับสินค้าเพียงครั้งเดียวเช่นในหมวดหมู่ 1-10 ที่มีไม่ได้หมายความว่าสำหรับการประเมินความน่าเชื่อถือภายในโดยใช้ดัชนีเช่นอัลฟาของครอนบาค ดังนั้นจึงเป็นไปไม่ได้ในการประเมินความถูกต้องของการจัดอันดับเป็นมาตรการของการรับรู้ของผู้ชม สร้างความถูกต้องจะต้องมีการสร้างความน่าเชื่อถือทั้งในและความถูกต้อง (เช่นการจัดอันดับว่าเป็นตัวแทนของสิ่งที่พวกเขาควรจะเป็นตัวแทน) ระดับของความถูกต้องของเครื่องดนตรีได้โดยเริ่มต้นจะถูกกำหนดผ่านการประยุกต์ใช้ตรรกะ / หรือวิธีการทางสถิติ. "ขั้นตอนการวัดที่ถูกต้องเป็นไป การศึกษาระดับปริญญามาตรการว่าถ้าสิ่งที่นำเสนอในการวัด "อีกปัญหาพื้นฐานคือการจัดอันดับออนไลน์มักจะเกี่ยวข้องกับการสุ่มตัวอย่างความสะดวกสบายเหมือนโพลล์โทรทัศน์คือพวกเขาเป็นเพียงความคิดเห็นของผู้ที่มีความโน้มเอียงที่จะส่งการให้คะแนน. ตั้งแต่วันที่เกี่ยวข้องกับด้านต่างๆของกระบวนการวัด แต่ละประเภทนี้ใช้ตรรกะการตรวจสอบทางสถิติหรือทั้งสองอย่างเพื่อกำหนดระดับของความถูกต้องและมีค่าพิเศษภายใต้เงื่อนไขบาง ประเภทของความถูกต้องรวมถึงความตรงตามเนื้อหาความถูกต้องคาดการณ์และสร้างความถูกต้อง. สุ่มตัวอย่าง [แก้ไข] ข้อผิดพลาดในการเก็บตัวอย่างสามารถนำไปสู่ผลลัพธ์ที่มีอคติเฉพาะเจาะจงหรือเป็นเพียงความเกี่ยวข้องกับกลุ่มย่อยที่เฉพาะเจาะจง พิจารณาตัวอย่างนี้สมมติว่าเป็นภาพยนตร์เพียงดึงดูดความสนใจของผู้เชี่ยวชาญผู้ชม 90% ของพวกเขาเป็นที่ชื่นชอบของประเภทนี้และมีเพียง 10% เป็นคนที่มีความสนใจในภาพยนตร์ สมมติว่าหนังเรื่องนี้เป็นที่นิยมมากในหมู่ผู้ชมที่มองมันและให้เฉพาะผู้ที่รู้สึกมากที่สุดเกี่ยวกับภาพยนตร์เรื่องนี้มีแนวโน้มที่จะประเมินภาพยนตร์ออนไลน์ ด้วยเหตุนี้ผู้ประเมินจะวาดจากสาวก ชุดนี้อาจนำไปสู่การจัดอันดับที่สูงมากของภาพยนตร์ซึ่งไม่ได้คุยนอกเหนือจากคนที่จริงดูหนัง (หรืออาจเป็นไปได้เกินกว่าผู้ที่จริงคะแนน). คำอธิบายเชิงคุณภาพ [แก้ไข] คำอธิบายเชิงคุณภาพของประเภทการปรับปรุงประโยชน์ของการที่ มาตราส่วน ตัวอย่างเช่นถ้าเพียง แต่จุดที่ 1-10 จะได้รับโดยไม่ต้องคำอธิบายบางคนอาจเลือก 10 ไม่ค่อยขณะที่คนอื่นอาจเลือกประเภทที่มักจะ ถ้าแทน "10" อธิบายว่า "ที่อยู่ใกล้ที่สมบูรณ์แบบ" หมวดหมู่มีแนวโน้มที่จะหมายถึงสิ่งเดียวกันกับคนที่แตกต่างกัน นี้ใช้กับทุกประเภทไม่เพียง แต่จุดที่รุนแรง. ปัญหาดังกล่าวข้างต้นจะประกอบเมื่อรวมสถิติเช่นค่าเฉลี่ยที่ใช้สำหรับรายการและการจัดอันดับของผลิตภัณฑ์ คะแนนของผู้ใช้ที่มี categorizations ลำดับที่ดีที่สุด ในขณะที่มันไม่ใช่เรื่องแปลกในการคำนวณค่าเฉลี่ยหรือหมายความว่าข้อมูลดังกล่าวการทำเช่นนั้นไม่เป็นธรรมเพราะในการคำนวณค่าเฉลี่ยระยะเท่ากันจะต้องเป็นตัวแทนของความแตกต่างที่เหมือนกันระหว่างระดับของการรับรู้ที่มีคุณภาพ ประเด็นสำคัญที่มีการรวมข้อมูลขึ้นอยู่กับชนิดของเครื่องชั่งคะแนนที่ใช้กันทั่วไปออนไลน์มีดังนี้ค่าเฉลี่ยไม่ควรจะคำนวณข้อมูลของชนิดที่เก็บรวบรวม. มันมักจะเป็นไปไม่ได้ในการประเมินความน่าเชื่อถือหรือความถูกต้องของการจัดอันดับผู้ใช้. ผลิตภัณฑ์ไม่ได้เมื่อเทียบ ด้วยความเคารพอย่างชัดเจนให้ [ชี้แจงจำเป็น] ร่วมกันเพียงอย่างเดียวเกณฑ์. เฉพาะผู้ใช้ที่มีแนวโน้มที่จะส่งคะแนนสำหรับผลิตภัณฑ์ที่ทำเช่นนั้น. ข้อมูลที่ไม่ได้รับการตีพิมพ์มักจะอยู่ในรูปแบบที่อนุญาตให้การประเมินผลการจัดอันดับสินค้า. วิธีการพัฒนาอื่น ๆ รวมถึงการสร้างแบบจำลองทางเลือก หรือวิธีการที่แตกต่างสูงสุดหลังเป็นที่เกี่ยวข้องกับรูปแบบ Rasch เนื่องจากการเชื่อมต่อระหว่างกฎหมาย Thurstone ของคำพิพากษาเปรียบเทียบ [ชี้แจงจำเป็น] และรูปแบบ Rasch


















การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
ความถูกต้อง [ แก้ไข ]
ความถูกต้องหมายถึงวิธีการที่ดีเครื่องมือวัดว่ามันตั้งใจที่จะวัด กับผู้ใช้แต่ละอันดับสินค้าเพียงครั้งเดียว ตัวอย่างเช่น ในประเภทตั้งแต่ 1 ถึง 10 มีวิธีการประเมินโดยใช้ดัชนีความเที่ยงภายใน เช่น ค่าสัมประสิทธิ์ครอนบาคแอลฟา จึงเป็นไปไม่ได้ที่จะประเมินความถูกต้องของการจัดอันดับเป็นมาตรการของตัวแสดงอีกด้วยสร้างความถูกต้องจะต้องสร้างทั้งความน่าเชื่อถือและความถูกต้อง ( เช่นการจัดอันดับเป็นตัวแทนของสิ่งที่พวกเขาควรจะแสดง ) ระดับของความถูกต้องของเครื่องมือที่ถูกกำหนดโดยการใช้ตรรกะ หรือกระบวนการทางสถิติ " การวัดขั้นตอนที่ถูกต้องในระดับที่ถ้ามาตรการที่เสนอมาตรการ "

อีกประเด็นคือพื้นฐานที่จัดอันดับออนไลน์มักจะเกี่ยวข้องกับความสะดวกสบายตัวอย่างมากเช่นโพลล์โทรทัศน์เช่นที่พวกเขาแสดงเฉพาะความคิดเห็นของบรรดาหัวส่งคะแนน

ความถูกต้องที่เกี่ยวข้องกับแง่มุมที่แตกต่างกันของกระบวนการวัด แต่ละประเภทเหล่านี้ใช้ตรรกะสถิติการตรวจสอบหรือทั้งสองเพื่อตรวจสอบระดับของความถูกต้องและมีมูลค่าพิเศษภายใต้เงื่อนไขบางอย่าง ประเภทของเครื่องมือรวมถึงเนื้อหาเชิงพยากรณ์และสร้างความถูกต้อง

) [ แก้ไข ]
ความคลาดเคลื่อนสามารถนำไปสู่ผลลัพธ์ที่เฉพาะเจาะจงมี อคติ หรือมีความเกี่ยวข้องกับความสัมพันธ์ที่เฉพาะเจาะจง พิจารณาตัวอย่างนี้ :สมมติว่าเป็นเพียงภาพยนตร์ดึงดูดผู้เชี่ยวชาญ audience-90 % ของพวกเขาเป็นสาวกของประเภทนี้และมีเพียง 10 % เป็นผู้ที่มีความสนใจทั่วไปในหนัง ถือว่าเป็นภาพยนตร์ที่เป็นที่นิยมมากในหมู่ผู้ชมที่ชม และให้เฉพาะผู้ที่รู้สึกอย่างมากที่สุดเกี่ยวกับภาพยนตร์มีแนวโน้มที่จะคะแนนภาพยนตร์ออนไลน์ ดังนั้นผู้ประเมินทั้งหมดวาดจากสาวก .การรวมกันนี้อาจนำไปสู่การจัดอันดับสูงมากของภาพยนตร์ที่ไม่ได้ลงความเห็นเกินกว่าคนที่เห็น ฟิล์ม ( หรืออาจจะมากกว่านั้น ที่จริงคะแนน )

คุณภาพรายละเอียด [ แก้ไข ]
คุณภาพรายละเอียดของประเภทปรับปรุงประโยชน์ของมาตราส่วนประมาณค่า ตัวอย่างเช่น ถ้าคะแนน 1-10 จะได้รับโดยไม่ต้องบรรยาย บางคนอาจเลือก 10 แทบในขณะที่คนอื่น ๆอาจเลือกประเภทที่มักจะ ถ้า แทน " 10 " ที่อธิบายเป็น " ใกล้ไร้ที่ติ " , ประเภทมีแนวโน้มที่จะหมายถึงสิ่งเดียวกันกับผู้คนที่แตกต่างกัน นี้ใช้กับทุกประเภท ไม่ใช่แค่มากคะแนน

ปัญหาข้างต้นประกอบ เมื่อรวมสถิติเช่นค่าเฉลี่ยที่ใช้สำหรับรายชื่อและการจัดอันดับของผลิตภัณฑ์การจัดอันดับผู้ใช้ที่ดีที่สุด . วิภัตติ . ในขณะที่มันไม่ได้ผิดปกติเพื่อคำนวณค่าเฉลี่ย หรือ หมายถึงข้อมูล ดังกล่าว ทำให้ ไม่เป็นธรรม เพราะในการคำนวณค่าเฉลี่ย ช่วงเวลาที่เท่ากันจะต้องแสดงถึงความแตกต่างกันระหว่างระดับของการรับรู้คุณภาพ ประเด็นสําคัญกับรวมข้อมูลขึ้นอยู่กับชนิดของแบบประเมินที่ใช้กันทั่วไปมีดังนี้

ทางออนไลน์ค่าเฉลี่ยไม่ควรคำนวณสำหรับข้อมูลชนิดเก็บ .
มันมักจะเป็นไปไม่ได้ที่จะประเมินความน่าเชื่อถือหรือความถูกต้องของคะแนนผู้ใช้
ผลิตภัณฑ์ไม่เมื่อเทียบกับความชัดเจน ปล่อยให้อยู่คนเดียวบ่อย [ ชี้แจงจำเป็น ] , เกณฑ์ .
ผู้ใช้เท่านั้นแนวโน้มที่จะส่งคะแนนผลิตภัณฑ์ทำ .
ข้อมูล มักจะไม่อนุญาตให้เผยแพร่ในรูปแบบการประเมินของผลิตภัณฑ์
อันดับเครดิตพัฒนาเพิ่มเติมโดยรวมแบบจำลองทางเลือกหรือวิธีการแตกต่างสูงสุด หลังถูกเกี่ยวข้องกับรูปแบบวิธีการเชื่อมต่อระหว่างตนเอง เนื่องจากกฎหมายของการเปรียบเทียบการตัดสิน [ ต้องการ ] และรูปแบบวิธี .
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2025 I Love Translation. All reserved.

E-mail: