The present study was an attempt to compensate for the shortcomings in the previous Academic corpora (e.g. inadequate corpus size), and also the famous wordlists (i.e. AWL and GSL) which were derived from those corpora. The most influential academic word list to date, is AWL developed by Coxhead (2000). The list was the inspiration for many textbook developers, instructors and also education programmers throughout the world. Considering the fact that the corpus from which a certain list is drawn affects the validity and applicability of the list, and whether the list can be employed in ESP education for a certain academic genre. Coxhead‟s AWL was made using the 3.5-million-word-corpus developed at the time. The corpus for AWL was made using different pieces of texts from several academic fields including fields from both hard and soft sciences.
About fifty years before the AWL, with the advent of computer technology and the ability to process large bodies of information, West (1953) compiled a 5-million-Coprpus from which he made GSL. GSL was not considered an academic list due to its corpus, which did not contain academic texts.
Assuming the above argument one can propose that the more specific a corpus is, the more applicable the list drawn from that corpus can be. Some field-specific vocabulary lists have been developed in the past few years using more specialized corpora, to make for the needs of particular learners (Wang, Liang,& Ge, 2008; Coxhead & Hirsh, 2007; Ward, 2009; Chung, 2009).
Unlike the corpus developed by Coxhead (2000), the researchers used smaller pieces of texts from a variety of fields, since the longer texts ,e.g. books, may have biased the corpus in some way. The 4-million-word-corpus was made from 600 research articles from six main fields under the hard sciences category, namely Energy Engineering, Electrical Engineering, Mechanic Engineering, Computer Sciences, Chemistry and Physics. Development of Hard Sciences corpus through this study exploring the coverage of AWL and GSL word families in them was the core purpose of this study.
The first question that was pose was, what percentage of the words in the Hard Sciences Corpus the AWL covers. After the data analysis it was revealed that AWL covered 16 percent of the whole words in the corpus. This is a higher percentage compared to the study done by Hyland & Tse (2007), in which they measured 10 percent coverage of AWL in a 3.292-million-words-corpus made from the writings of sciences, engineering, and social sciences students and professionals.
Chen & Ge (2007) made a 190425-word corpus of Medical Sciences Research articles, and found that AWL covered 10.073 percent of the words in their corpus. This study was the only attempt to create a corpus only with Research Articles.
There have been several studies exploring the coverage of AWL in their respective corpora, which have reported various percentages of coverage ranging from 1.4 percent to 11.51 percent (see Coxhead 2000a &2000b; Cobb & Horst, 2004; Konstantakis, 2007; Coxhead & Hirsh 2007; Ward, 2009; Martı´nez, Beck, & Panza 2009; Vongpumivitch, Huang, & Chang, 2009; Li & Qian, 2010; Coxhead, Stevens, & Tinkle, 2010).
The study that has reported the widest coverage of AWL in its corpus (about 11.51 percent), was Konstantakis (2007), who compiled a corpus of about one million words form Business Research Articles. The present corpus for this study, having 16 percent coverage of AWL is one of the most valid corpora up to now.
The second question of high importance for this study was related to GSL. The researchers tried to find the coverage of GSL in the Hard Sciences corpus. After the analyses it was revealed that GSL covered an average of about 80 percent of the sub-corpora, and about 78.4 percent of the whole hard sciences corpus. 80 percent coverage of GSL in hard sciences Corpus is slightly higher than the amount proposed by Coxhead (1998) (cited in Coxhead, 2000), that was 76 percent coverage for GSL in academic corpus. This also confirms that the Hard Sciences Corpus developed in this study is a valid corpus and is in line with other corpora developed earlier. On the other hand considering the higher coverage of AWL in Hard Sciences corpus (i.e. 16 percent), the corpus seems to be more useful than the previous similar corpora for academic purposes.
ศึกษาเป็นความพยายามเพื่อชดเชยข้อบกพร่องในกลุ่มเนื้อเยื่อศึกษาก่อนหน้า (เช่นขนาดพอคอร์ปัส), และมีชื่อเสียงรายชื่อคำ (เช่น AWL และ GSL) ซึ่งได้มาจากกลุ่มเนื้อเยื่อเหล่านั้น มีอิทธิพลมากทางวิชาการรายการของคำวัน เป็น AWL ที่พัฒนา โดย Coxhead (2000) รายการได้แรงบันดาลใจหลายตำรานักพัฒนา ผู้สอน และศึกษาโปรแกรมเมอร์ทั่วโลก พิจารณาความจริงที่ว่า corpus ออกบางรายการที่มีผลต่อความถูกต้องและความเกี่ยวข้องของรายการ และว่ารายการสามารถนำมาใช้ในการศึกษา ESP สำหรับประเภทวิชาการบาง Coxhead‟s AWL ทำใช้ 3.5 ล้านคำ-corpus พัฒนาในเวลา คอร์ปัสสำหรับ AWL ถูกทำโดยใช้ส่วนต่าง ๆ ของข้อความจากหลายเขตข้อมูลวิชาการรวมทั้งฟิลด์จากศาสตร์ทั้งแข็ง และอ่อนประมาณห้าสิบปีก่อน AWL กับการถือกำเนิดของเทคโนโลยีคอมพิวเตอร์และความสามารถในกระบวนการร่างกายขนาดใหญ่ของข้อมูล ตะวันตก (1953) 5-ล้าน-Coprpus ที่ทำ GSL ที่รวบรวม GSL ไม่เป็นรายการการศึกษาเนื่องจากเป็นคอร์ปัส ซึ่งไม่ประกอบด้วยตำราวิชาการสมมติว่าอาร์กิวเมนต์ข้างหนึ่งสามารถเสนอว่า ยิ่งเป็นคอร์ปัส ยิ่งมีรายการจากสถานีที่สามารถ บางรายการคำศัพท์เฉพาะของเขตได้รับการพัฒนาในปีผ่านมาใช้เฉพาะกลุ่มเนื้อเยื่อ การทำให้ความต้องการของผู้เรียนโดยเฉพาะ (วัง เหลียง และ Ge, 2008 Coxhead & Hirsh, 2007 วอร์ด 2009 ชุง 2009)ต่างจาก corpus ที่พัฒนา โดย Coxhead (2000), นักวิจัยใช้ชิ้นเล็ก ๆ ของข้อความจากเขตข้อมูล ข้อความอีกต่อไป เช่น หนังสือ อาจมีลำเอียงคอร์ปัสในบางวิธี 4 คำคอร์ปัสล้านทำจากบทความวิจัย 600 จากหกหลักฟิลด์ภายใต้ประเภทวิทยาศาสตร์ยาก คือ วิศวกรรมพลังงาน วิศวกรรมไฟฟ้า ช่างวิศวกรรม วิทยาศาสตร์คอมพิวเตอร์ เคมี และฟิสิกส์ พัฒนาของคอร์ปัสวิทยาศาสตร์ยากผ่านการสำรวจความครอบคลุมของ AWL และ GSL ครอบครัวคำในการศึกษานี้มีวัตถุประสงค์หลักของการศึกษานี้คำถามแรกที่ก่อให้เกิดเป็น เปอร์เซ็นต์ของคำใน Corpus วิทยาศาสตร์ยาก AWL ครอบคลุม หลังจากการวิเคราะห์ข้อมูล ปรากฏว่า AWL ครอบคลุม 16 เปอร์เซ็นต์ของคำทั้งหมดใน corpus นี้เป็นสัดส่วนสูงเมื่อเทียบกับการศึกษาทำ โดยไฮและ Tse (2007), ซึ่งจะวัดได้ครอบคลุมร้อยละ 10 ของ AWL ใน 3.292-ล้านคำคอร์ปัสจากงานเขียนของวิทยาศาสตร์ วิศวกรรมศาสตร์ สังคมศาสตร์ และนักศึกษาและผู้เชี่ยวชาญเฉินและ Ge (2007) ทำคอร์ปัส 190425 คำของบทความวิจัยด้านวิทยาศาสตร์การแพทย์ และพบว่า AWL ครอบคลุม 10.073 เปอร์เซ็นต์ของคำในคอร์ปัสของพวกเขา การศึกษานี้เป็นเพียงพยายามสร้างคอร์ปัสเป็นบทความวิจัยเท่านั้นมีการศึกษาหลายการสำรวจความครอบคลุมของ AWL ในของพวกเขาเกี่ยวข้องกลุ่มเนื้อเยื่อ ซึ่งมีรายงานหลายเปอร์เซ็นต์ความคุ้มครองตั้งแต่ 1.4 เปอร์เซ็นต์ร้อยละ 11.51 (ดู Coxhead 2000a และ 2000b คดและ Horst, 2004 Konstantakis, 2007 Coxhead-Hirsh 2007 วอร์ด 2009 Martı´nez เบ็ค และ Panza 2009 Vongpumivitch หวง และ ช้าง 2009 Li และเคียน 2010 Coxhead ปกรณ์ลัม และ กริ๊ง 2010)การศึกษาที่รายงานความครอบคลุมกว้างที่สุดของ AWL ในของคอร์ปัส (ประมาณ 11.51%), มีบทความวิจัยธุรกิจแบบ Konstantakis (2007), ผู้คอร์ปัสประมาณหนึ่งล้านคำ คอร์ปัสปัจจุบันสำหรับการศึกษานี้ มีความครอบคลุมร้อยละ 16 ของ AWL เป็นกลุ่มเนื้อเยื่อที่ถูกต้องมากที่สุดถึงตอนนี้อย่างใดอย่างหนึ่งคำถามที่สองมีความสำคัญสูงสำหรับการศึกษานี้ไม่เกี่ยวข้องกับ GSL นักวิจัยพยายามหาความครอบคลุมของ GSL ใน corpus วิทยาศาสตร์ยาก หลังจากการวิเคราะห์ จะถูกเปิดเผยว่า GSL ที่ครอบคลุมโดยเฉลี่ยประมาณร้อยละ 80 ของกลุ่มเนื้อเยื่อที่ย่อย และประมาณร้อยละ 78.4 ของคอร์ปัสยากทั้งวิทยาศาสตร์ ความครอบคลุมร้อยละ 80 ของ GSL ใน Corpus เป็นเล็กน้อยสูงกว่าจำนวนเงินที่เสนอ โดย Coxhead (1998) (อ้างใน Coxhead, 2000), ที่ครอบคลุมร้อยละ 76 GSL ในคอร์ปัสศึกษา ศาสตร์ยาก นี้ยังยืนยันว่า คอร์ปัสศาสตร์ยากที่พัฒนาในการศึกษานี้เป็นคอร์ปัสถูกต้อง และสอดคล้องกับกลุ่มเนื้อเยื่ออื่น ๆ พัฒนาก่อนหน้านี้ คง พิจารณาครอบคลุมสูงของ AWL ในคอร์ปัสวิทยาศาสตร์ยาก (เช่นร้อยละ 16), corpus น่าจะมีประโยชน์มากขึ้นกว่ากลุ่มเนื้อเยื่อที่คล้ายคลึงกันก่อนหน้านี้เพื่อการศึกษา
การแปล กรุณารอสักครู่..

การศึกษาครั้งนี้ เป็นความพยายามเพื่อชดเชยข้อบกพร่องในก่อนหน้านี้นักวิชาการคลังข้อมูล ( เช่นคลังข้อมูลขนาดไม่เพียงพอ ) , และยัง wordlists มีชื่อเสียง ( เช่นสว่านและ GSL ) ซึ่งได้มาจากคลังประโยคเหล่านั้น ที่มีอิทธิพลมากที่สุดรายการคำวิชาการวันที่เป็นสว่านที่พัฒนาโดย coxhead ( 2000 ) รายการ เป็นแรงบันดาลใจให้นักพัฒนาตำราหลาย อาจารย์ และยังศึกษาโปรแกรมเมอร์ทั่วโลก พิจารณาข้อเท็จจริงที่ว่าข้อมูลที่รายการหนึ่งจะวาดต่อความถูกต้องและความเกี่ยวข้องของรายการ ว่ารายการที่สามารถใช้ในระบบการศึกษาเพื่องานบางประเภท coxhead ‟ด้วยสว่านให้ใช้ 3.5-million-word-corpus พัฒนาตลอดเวลา คลังข้อมูลสำหรับสว่านให้ใช้ชิ้นส่วนที่แตกต่างกันของข้อความจากเขตข้อมูลทางวิชาการหลายสาขาทั้งหนักและเบา รวมทั้งวิทยาศาสตร์เกี่ยวกับ 50 ปีก่อน สว่าน กับการมาถึงของเทคโนโลยีคอมพิวเตอร์และความสามารถในการประมวลผลขนาดใหญ่เนื้อข้อมูล ตะวันตก ( 1953 ) รวบรวม 5-million-coprpus ซึ่งเขาทำ GSL . GSL ไม่ได้พิจารณารายการวิชาการ เนื่องจากเป็นข้อมูลที่ไม่ได้มีข้อความเชิงวิชาการสมมติว่าอาร์กิวเมนต์หนึ่งสามารถเสนอข้างต้นที่เฉพาะเจาะจงมากขึ้นเป็นคลังข้อมูล ยิ่งได้รายชื่อมาจากที่สะสมได้ บางส่วนของเขตข้อมูลที่เฉพาะเจาะจง รายการคำศัพท์ได้ถูกพัฒนาขึ้นในช่วงไม่กี่ปีที่ผ่านมาการใช้คลังข้อมูลเฉพาะมากขึ้น เพื่อที่จะให้สำหรับความต้องการของผู้เรียนโดยเฉพาะ ( หวัง เหลียง และ GE , 2008 ; coxhead & เฮิร์ช , 2007 ; วอร์ด 2009 ; ชุง , 2009 )ซึ่งแตกต่างจากคลังข้อมูลที่พัฒนาโดย coxhead ( 2000 ) , นักวิจัยที่ใช้ชิ้นส่วนขนาดเล็กของข้อความจากหลายๆ ด้าน เนื่องจากข้อความยาวหนังสือ เช่น อาจจะมีลำเอียงคลังข้อมูลในบางวิธี การ 4-million-word-corpus ทำจาก 600 บทความวิจัยจากหกหลักภายใต้หมวดหมู่วิทยาศาสตร์ยาก ได้แก่ วิศวกรรมพลังงาน วิศวกรรมไฟฟ้า เครื่องกล วิศวกรรมศาสตร์ คอมพิวเตอร์ เคมี และฟิสิกส์ การพัฒนาคลังข้อมูลวิทยาศาสตร์ยากผ่านการศึกษาสํารวจความครอบคลุมของสว่านและครอบครัวคํา GSL ในพวกเขาเป็นวัตถุประสงค์หลักของการศึกษานี้คำถามแรกที่โพสคือเปอร์เซ็นต์ของคำในคลังข้อมูลวิทยาศาสตร์ยากสว่านครอบคลุม จากการวิเคราะห์ข้อมูลพบว่า สว่าน ครอบคลุม 16 เปอร์เซ็นต์ของคำทั้งหมดในคลังข้อมูล นี้เป็นเปอร์เซ็นต์ที่สูงขึ้นเมื่อเทียบกับการศึกษาทำโดยไฮแลนด์ & TSE ( 2007 ) , ที่พวกเขาวัดความครอบคลุมร้อยละ 10 ของสว่านใน 3.292-million-words-corpus สร้างจากงานเขียนของวิทยาศาสตร์ วิศวกรรม และนักศึกษาสาขาวิชาสังคมศาสตร์และผู้เชี่ยวชาญเฉิน & GE ( 2007 ) ได้ 190425 คำคลังบทความวิจัยทางวิทยาศาสตร์การแพทย์ พบว่า ร้อยละ 10.073 สว่านครอบคลุมของคำในคลังข้อมูลของ การศึกษานี้ คือ ความพยายามเท่านั้นที่จะสร้างคลังข้อมูลเฉพาะกับบทความวิจัยมีหลายการศึกษาสํารวจความครอบคลุมของตนสว่านในคลังข้อมูล ซึ่งได้มีการรายงานค่าต่างๆของความคุ้มครองตั้งแต่ 1.4 เปอร์เซ็นต์ โดยเปอร์เซ็นต์ ( ดู coxhead ประกอบ & 2000b ; Cobb & Horst , 2004 ; konstantakis , 2007 ; coxhead & Hirsh 2007 ; วอร์ด 2009 ; มาร์ทı´เนซ เบ็ค และ panza 2009 ; vongpumivitch ฮุง และ ชาง , 2009 ; Li & Qian , 2010 ; coxhead , สตีเว่น , กุ๊กกิ๊ก , 2010 )การศึกษานี้ได้รายงานความคุ้มครองที่กว้างที่สุดของสว่านในคลังข้อมูล ( เรื่องโดยเปอร์เซ็นต์ ) , konstantakis ( 2007 ) ที่รวบรวมข้อมูลประมาณหนึ่งล้านคำรูปแบบบทความวิจัยทางธุรกิจ คลังข้อมูลปัจจุบันการศึกษามีความครอบคลุมร้อยละ 16 ของสว่านเป็นคลังข้อมูลที่ถูกต้องที่สุดจนถึงตอนนี้คำถามที่สองความสำคัญสูงในการวิจัยที่เกี่ยวข้องกับ GSL . นักวิจัยพยายามที่จะค้นหาความคุ้มครองของ GSL ในคลังข้อมูลวิทยาศาสตร์ยาก หลังจากการวิเคราะห์พบว่า GSL ครอบคลุม เฉลี่ยประมาณร้อยละ 80 ของคลังข้อมูลย่อยและ 78.4 เปอร์เซ็นต์ของทั้งหมดยากวิทยาศาสตร์คลังข้อมูล ความครอบคลุมร้อยละ 80 ของ GSL ในคลังข้อมูลวิทยาศาสตร์ยากเล็กน้อยสูงกว่าจำนวนเงินที่เสนอโดย coxhead ( 1998 ) ( อ้างใน coxhead , 2000 ) ที่ครอบคลุมร้อยละ 76 สำหรับ GSL ในคลังข้อมูลทางวิชาการ นี้ยังยืนยันว่าคลังวิทยาศาสตร์ยากพัฒนาขึ้นในการศึกษานี้เป็นข้อมูลที่ถูกต้องและ สอดคล้องกับการพัฒนาคลังข้อมูลอื่น ๆก่อนหน้านี้ บนมืออื่น ๆพิจารณาสูงครอบคลุมสว่านใน Corpus วิทยาศาสตร์ยาก ( เช่น 16 เปอร์เซ็นต์ ) , คลังข้อมูลน่าจะมีประโยชน์มากขึ้นกว่าเดิมคล้ายคลังข้อมูลเพื่อวัตถุประสงค์ทางวิชาการ
การแปล กรุณารอสักครู่..
