Compare Parse TreesBesides the pars

Compare Parse Trees
Besides the parser being language dependent, the comparison process is also
language dependent. Therefore, checking a new language requires a new set of
programs because different programming languages have their own grammar
structure and characteristics. This section introduces the approach that can be
generally used in checking for plagiarism with parse trees.
After all programs have been converted into parse trees, all parse trees will
be compared with one another in pairs. The following steps will be performed to
check the similarity of a pair of parse trees:
Step 1: Break down the parse tree into the sub-trees and classify those sub-trees
into different groups according to their types (e.g. methods and
variables). Each sub-tree stands for one type of programs in a program
segment.
Step 2: If the sub-tree consists of other structures, then repeat step 1. Otherwise, if all nodes in two sub-trees are of the same type or same group of
222 S. C. Ng, S. O. Choy and R. Kwan
program structures, they will be compared with each other. A score will
be given for the similarity of a pair of sub-trees.
Step 3: A matrix of similarity for the members in two groups will then be
formed. The next step is to find the most similar pair of members and
calculate the similarity using the weights for the group.
Step 4: Sum up the scores for all sub-trees. The final score, which indicates
how similar the two sub-trees are, is displayed.
After making comparisons of a set of programs, the result is produced in
a tabular form, as shown in Figure 2. From Figure 2, it can be shown that
each program will be compared with every other program in the program
pool. For example, the similarity between the LogonMenu.java and
Registration.java programs is 18.94%, and the similarity between the
LogonMenu.java and ShopHistory.java programs is 30.36%.
In addition to our new algorithm, some enhancements on flexibility and
accuracy in detecting plagiarism are also introduced in our system. The
following sections describe these enhancements.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

เปรียบเทียบต้นไม้ในการแยกวิเคราะห์นอกจากตัวแยกวิเคราะห์เป็นภาษาที่ขึ้นอยู่กับ การเปรียบเทียบเป็นขึ้นอยู่กับภาษา ดังนั้น การตรวจสอบภาษาใหม่ต้องชุดใหม่โปรแกรมเนื่องจากภาษาเขียนโปรแกรมมีไวยากรณ์ของตัวเองโครงสร้างและลักษณะ ส่วนนี้แนะนำวิธีที่สามารถโดยทั่วไปใช้ในการตรวจสอบการโจรกรรมทางวรรณกรรมด้วยต้นไม้ในการแยกวิเคราะห์หลังจากที่ได้แปลงเป็นต้นไม้ในการแยกวิเคราะห์โปรแกรมทั้งหมด ทุกแยกจะต้นไม้สามารถเปรียบเทียบกันได้ในคู่ ขั้นตอนต่อไปนี้จะดำเนินการตรวจสอบความคล้ายกันของคู่ของต้นไม้ในการแยกวิเคราะห์:ขั้นตอนที่ 1: แบ่งแผนภูมิแยกลงในต้นไม้ย่อย และจัดประเภทต้นไม้ย่อยเหล่านั้นเป็นกลุ่มต่าง ๆ ตามชนิดของพวกเขา (เช่นวิธีการ และตัวแปร) แต่ละทรีย่อยหมายถึงประเภทหนึ่งของโปรแกรมในโปรแกรมเซ็กเมนต์ขั้นตอนที่ 2: ถ้าทรีย่อยประกอบด้วยโครงสร้างอื่น แล้วทำซ้ำขั้นตอน 1 อื่น ๆ ถ้ามีโหนดทั้งหมดในทรีย่อยสองชนิดเดียวกันหรือกลุ่มเดียวกัน222 S. C. Ng, S. โอ Choy และ R. ขวัญโปรแกรมโครงสร้าง พวกเขาจะเปรียบเทียบกัน คะแนนจะได้รับในเฉพาะคู่ของต้นไม้ย่อยขั้นตอนที่ 3: เมตริกซ์ของความคล้ายคลึงกันสำหรับสมาชิกในกลุ่มที่สองจะเป็นเกิดขึ้น ขั้นตอนต่อไปคือการ หาคู่เหมือนกันมากที่สุดของสมาชิก และคำนวณความคล้ายคลึงกันโดยใช้น้ำหนักสำหรับกลุ่มขั้นตอนที่ 4: รวมค่าคะแนนสำหรับต้นไม้ย่อยทั้งหมด สกอร์ ซึ่งบ่งชี้ลักษณะคล้ายต้นไม้ย่อยสองอยู่ อยู่หลังจากทำการเปรียบเทียบชุดโปรแกรม ผลที่ผลิตในตารางฟอร์ม เป็นแสดงในรูปที่ 2 จากรูปที่ 2 มันสามารถแสดงที่แต่ละโปรแกรมจะเปรียบเทียบกับทุกโปรแกรมในโปรแกรมสระว่ายน้ำ ตัวอย่าง ความคล้ายกันระหว่าง LogonMenu.java การ และโปรแกรม Registration.java เป็น 18.94% และความคล้ายคลึงกันระหว่างการโปรแกรม LogonMenu.java และ ShopHistory.java เป็น 30.36%นอกจากของเราใหม่อัลกอริทึม การปรับปรุงบางอย่างบนความยืดหยุ่น และความแม่นยำในการตรวจสอบการโจรกรรมทางวรรณกรรมมียังได้รับการแนะนำระบบของเรา ที่ส่วนต่อไปนี้อธิบายการปรับปรุงเหล่านี้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

เปรียบเทียบการแยกวิเคราะห์ต้นไม้
นอกจากภาษาแยกวิเคราะห์เป็นขึ้นอยู่กับขั้นตอนการเปรียบเทียบนี้ยัง
ขึ้นอยู่กับภาษา ดังนั้นการตรวจสอบภาษาใหม่ต้องมีชุดใหม่ของ
โปรแกรมเพราะการเขียนโปรแกรมภาษาที่แตกต่างกันมีไวยากรณ์ของตัวเอง
โครงสร้างและลักษณะ ส่วนนี้จะแนะนำวิธีการที่สามารถนำมา
ใช้ในการตรวจสอบการขโมยความคิดที่มีต้นไม้แยก
หลังจากที่โปรแกรมทั้งหมดได้รับการแปลงเป็นต้นไม้แจงต้นไม้แจงทั้งหมดจะ
ถูกนำมาเปรียบเทียบกับคนอื่นเป็นคู่ ขั้นตอนต่อไปจะได้รับการดำเนินการเพื่อ
ตรวจสอบความคล้ายคลึงกันของคู่ของต้นไม้แยก:
ขั้นตอนที่ 1: ทำลายลงต้นไม้แยกเป็นย่อยต้นไม้และแยกประเภทย่อยที่ต้นไม้
เป็นกลุ่มที่แตกต่างกันตามประเภทของพวกเขา (เช่นวิธีการและ
ตัวแปร) แต่ละ sub ต้นไม้ย่อมาจากประเภทหนึ่งของโปรแกรมในโปรแกรม
ส่วน
ขั้นตอนที่ 2: ถ้าต้นไม้ย่อยประกอบด้วยโครงสร้างอื่น ๆ แล้วทำซ้ำขั้นตอนที่ 1 มิฉะนั้นถ้าโหนดทั้งหมดในสองย่อยไม้เป็นชนิดเดียวกันหรือเหมือนกัน กลุ่มของ
222 SC Ng, SO Choy และรขวัญ
โครงสร้างโปรแกรมพวกเขาจะถูกนำมาเปรียบเทียบกับคนอื่น ๆ คะแนนจะ
ได้รับสำหรับความคล้ายคลึงกันของคู่ของย่อยต้นไม้
ขั้นตอนที่ 3: เมทริกซ์ของความคล้ายคลึงกันของสมาชิกในกลุ่มที่สองนั้นจะ
เกิดขึ้น ขั้นตอนต่อไปคือการหาคู่ที่คล้ายกันมากที่สุดของสมาชิกและ
การคำนวณความคล้ายคลึงกันใช้น้ำหนักสำหรับกลุ่ม
ขั้นตอนที่ 4: สรุปคะแนนสำหรับทุกย่อยไม้ คะแนนสุดท้ายซึ่งแสดงให้เห็น
วิธีการที่คล้ายกันทั้งสองย่อยต้นไม้ที่จะปรากฏขึ้น
หลังจากที่การเปรียบเทียบของชุดของโปรแกรมผลที่มีการผลิตใน
รูปแบบตารางตามที่แสดงในรูปที่ 2 จากรูปที่ 2 จะสามารถแสดงให้เห็นว่า ว่า
แต่ละโปรแกรมจะได้รับเมื่อเทียบกับโปรแกรมอื่น ๆ ทุกคนในโครงการ
สระว่ายน้ำ ตัวอย่างเช่นความคล้ายคลึงกันระหว่าง LogonMenu.java และ
โปรแกรม Registration.java เป็น 18.94% และความคล้ายคลึงกันระหว่าง
โปรแกรม LogonMenu.java และ ShopHistory.java เป็น 30.36%
นอกจากอัลกอริทึมใหม่ของเราบางอย่างในการปรับปรุงความยืดหยุ่นและความ
ถูกต้องในการ การตรวจสอบการขโมยความคิดนอกจากนี้ยังนำมาใช้ในระบบของเรา
ส่วนต่อไปนี้อธิบายการปรับปรุงเหล่านี้

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

เปรียบเทียบแยกต้นไม้
นอกจากนี้ parser เป็นภาษาขึ้นอยู่กับกระบวนการเปรียบเทียบยัง
ภาษาขึ้นอยู่กับ ดังนั้น การตรวจสอบภาษาใหม่ต้องชุดใหม่
โปรแกรมเพราะการเขียนโปรแกรมภาษาอื่นมีลักษณะโครงสร้างไวยากรณ์
ของตัวเองและ ในส่วนนี้แนะนำวิธีการที่สามารถใช้โดยทั่วไปในการตรวจสอบการขโมยความคิด

กับแยกต้นไม้หลังจากที่โปรแกรมทั้งหมดจะถูกแปลงเป็นแยกต้นไม้ทุกต้นจะแยก
เปรียบเทียบกับอีกหนึ่งคู่ ขั้นตอนต่อไปนี้จะแสดง

ตรวจสอบความคล้ายคลึงกันของคู่แยกต้นไม้ :
1 : แบ่งแยกต้นไม้เข้าไปซบต้นไม้และแยกประเภทย่อยต้นไม้เหล่านั้น
เป็นกลุ่มที่แตกต่างกันตามประเภทของพวกเขา ( เช่นวิธีการและ
ตัวแปร )แต่ละย่อยต้นไม้ยืนสำหรับประเภทหนึ่งของโปรแกรมในส่วนโปรแกรม
.
ขั้นที่ 2 : ถ้าต้นไม้ย่อยประกอบด้วยโครงสร้างอื่น ๆ แล้วทำซ้ำขั้นตอนที่ 1 ถ้าโหนดทั้งหมดในสองย่อยต้นไม้ชนิดเดียวกัน หรือกลุ่มเดียวกัน
222 S . C . ของ เอส โอ อาร์ เพลงฉ่อย และควาน
โปรแกรมโครงสร้าง จะเทียบกับแต่ละอื่น ๆ คะแนนจะ
ได้รับความคล้ายคลึงกันของคู่ย่อยต้นไม้
ขั้นตอนที่ 3 :เมทริกซ์ของความคล้ายคลึงกันสำหรับสมาชิกในกลุ่มแล้วจะ
รูปแบบ ขั้นตอนต่อไปคือการหาคู่ที่เหมือนกันมากที่สุดของสมาชิกและ
การคำนวณความคล้ายโดยใช้น้ำหนักกลุ่ม
ขั้นตอนที่ 4 : สรุปคะแนนสำหรับต้นไม้ย่อยทั้งหมด คะแนนสุดท้ายซึ่งบ่งชี้
2 ย่อยต้นไม้เป็นวิธีที่คล้ายกันแสดง .
หลังจากการเปรียบเทียบของชุดของโปรแกรม ผลผลิตใน
เป็นรูปแบบตาราง ดังแสดงในรูปที่ 2 จากรูปที่ 2 มันสามารถแสดงให้เห็นว่า
แต่ละรายการจะถูกเปรียบเทียบกับทุกโปรแกรมอื่น ๆ ในโปรแกรม
สระ ตัวอย่างเช่น ความเหมือนและ logonmenu.java
โปรแกรม registration.java เป็น 1.90 % และความคล้ายคลึงกันระหว่าง
logonmenu.java และโปรแกรม shophistory.java เป็น 30.36 %
นอกจากขั้นตอนวิธีการใหม่ของเราการปรับปรุงบางส่วนในความยืดหยุ่นและความแม่นยำในการตรวจจับการขโมยความคิด
ยังแนะนำในระบบของเรา
ส่วนต่อไปนี้อธิบายถึงการปรับปรุงเหล่านี้

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.