In recent years, the World Wide Web has become an important and emergi การแปล - In recent years, the World Wide Web has become an important and emergi ไทย วิธีการพูด

In recent years, the World Wide Web

In recent years, the World Wide Web has become an
important and emerging source of information; this is because
of its rapid growth due to the increasing phenomenon of social
network contacts, online discussion forums, blogs, digitals
libraries and quick streaming news stories. The web content,
in the form of unstructured text, is useful in decision making.
Knowledge extraction from suchonline text is very important
for planning market strategies and decision making process.
KDT (knowledge discovery in texts) or text data mining or
text mining are terms used for the mining of unstructured or
semi-structured data. It is a slightly new sub-discipline of data
mining that considers textual data. The fact is that, "text data
mining" is an intermediate evolutionary lexical form, [1].The
Majority of the online information about data mining is
“misleading”. Such ambiguous/misleading information
implies to the mining metaphor that it is like “extracting
precious nuggets of ore from otherwise worthless rock" as
found in or finding "gold hidden inmountains of textual data"
in (D orre et al. 1999).A more narrow definition of what text
mining does is needed to distinguish it from the traditional IR,
which is basically "information access" as argued by Hearst
[1]. Retrieval of documents relevant to the information needs
of a user, is the primary concern of the traditional IR (perhaps
a more appropriate name would be data retrieval); however, the user is left on his/her own to find the desired information
in the documents. In Hearst’s opinion, data mining has not
only directed dealings with the information, but it also
attempts to uncover or glean previously unknown, information
from the data (text). Different linguistic levels (words,
sentences and documents) highlighting the key differences
between supervised machine learning methods, that rely on
annotated corpora or corpus-based, and unsupervised/lexiconbased methods in sentiment classification. Three main steps
are always involved in the process of text mining and
sentiment classification; they are (a) acquiring texts which are
relevant to the area of concern usually called IR; (b)
presenting contents collected from these texts in a format that
can be processed, such as statistical modelling, natural
language processing, etc.; and (c) actually using the
information in the presented format,[3] [4] communities [5]
[6]. Sentiment analysis has now become the dominant
approach used for extracting sentiment and appraisals from
online sources. Separating non-opinionated, neutral and
objective sentences and texts from subjective sentences
carrying heavy sentiments is a very difficult job; however, it
has been explored earnestly in a closely related yet separate
field, (J. M. Wiebe, 1994).It concentrates on making a
distinction between 'subjective' and 'objective' words and
texts; on one hand, the subjective ones give evaluations and
opinions and on the other, the objective ones are used to
present information which is factual (J. Wiebe, Wilson, R.
Bruce, Bell, & Martin, 2004) (J. Wiebe & Riloff, 2005). This
is different than sentiment analysis in regards to the set of
categories into which language units are classified by each of
these two analyses. Subjectivity analysis focuses on dividing
language units into two categories: objective and subjective,
whereas sentiment analysis attempts to divide the language
units into three categories;negative, positive and neutral. The
area of concentration in some of the early works was with
subjectivity detection only (J. M. Wiebe, 2000). With the
passage of time and a need for better understanding and
extraction, momentum slowly increased towards sentiment
classification and semantic orientation.
The rest of the paper is organized as follows: Section-II
presents the related research of the proposed work. Section-III
describes the proposed method with all steps. Section-IV
highlights the results and finally Section-V concludes the
proposed method.
0/5000
จาก: -
เป็น: -
ผลลัพธ์ (ไทย) 1: [สำเนา]
คัดลอก!
ในปีที่ผ่านมา เวิลด์ไวด์เว็บได้กลายเป็นการ แหล่งข้อมูล ความสำคัญ และเกิดขึ้นใหม่ ทั้งนี้เนื่องจาก การเจริญเติบโตอย่างรวดเร็วเนื่องจากปรากฏการณ์การเพิ่มขึ้นของสังคม เครือข่ายการติดต่อ คุยออนไลน์ บล็อก digitals ไลบรารีและสตรีมมิ่งข่าวด่วน เนื้อหาเว็บ ในรูปแบบของข้อความที่ไม่มีโครงสร้าง เป็นประโยชน์ในการตัดสินใจ สกัดความรู้จากข้อความ suchonline เป็นสิ่งสำคัญมาก การวางแผนกลยุทธ์การตลาดและกระบวนการทำให้ตัดสินใจ KDT (ค้นพบความรู้ข้อความ) หรือการทำเหมืองข้อมูลข้อความ หรือ การทำเหมืองข้อความคือ เงื่อนไขที่ใช้สำหรับการทำเหมืองที่ไม่มีโครงสร้าง หรือ ข้อมูลกึ่งโครงสร้าง มีวินัยย่อยเล็กน้อยใหม่ข้อมูล การทำเหมืองแร่ที่พิจารณาข้อมูลข้อความ ความจริงที่ว่า "ข้อมูลข้อความ เหมืองแร่"เป็นกลางวิวัฒนาการเกี่ยวกับคำศัพท์แบบ , [1] ที่ เป็นส่วนใหญ่ข้อมูลออนไลน์เกี่ยวกับการทำเหมืองข้อมูล "เข้าใจผิด" ข้อมูลไม่ชัดเจน/เข้าใจผิดใน หมายถึงการเทียบทำเหมืองที่เหมือน "แยก มีค่านักเก็ตของแร่จากหินอย่างสามหาว"เป็น พบใน หรือการค้นหา "ทองซ่อน inmountains ของข้อมูลเป็นข้อความ" ใน (D orre et al. 1999) คำนิยามที่แคบมากข้อความใด เหมืองแร่ไม่จำเป็นต้องใช้เพื่อแยกความแตกต่างจาก IR แบบดั้งเดิม ซึ่งเป็นพื้น "ข้อมูลเข้า" โต้เถียง โดย Hearst [1] การเรียกเอกสารที่เกี่ยวข้องกับข้อมูลที่จำเป็น ของผู้ใช้ ความกังวลหลักของ IR แบบดั้งเดิม (อาจจะเป็น ชื่อที่เหมาะสมจะเรียกข้อมูล); อย่างไรก็ตาม ผู้ใช้ทิ้งเขา/เธอเองค้นหาข้อมูลที่ต้อง ในเอกสาร ในความคิดของ Hearst การทำเหมืองข้อมูลไม่ได้ เฉพาะ ตรงกับข้อมูล แต่มันยัง ความพยายามที่จะเปิดเผย หรือไม่รู้จักก่อนหน้านี้ รวบรวมข้อมูล จากข้อมูล (ข้อความ) ระดับภาษาศาสตร์ (คำ ประโยคและเอกสาร) เน้นความแตกต่างที่สำคัญ ระหว่างเครื่องมีวิธีการเรียนรู้ ที่อาศัย corpora ประกอบหรือ ใช้คอร์พัสคริ unsupervised/lexiconbased วิธีในการจัดประเภทความเชื่อมั่น สามขั้นตอนหลัก มักเกี่ยวข้องในกระบวนการทำเหมืองข้อความ และ การจัดประเภทความเชื่อมั่น มีข้อความ acquiring (a) ซึ่งเป็น เกี่ยวข้องกับพื้นที่ของความกังวลที่มักจะเรียกว่า IR (b) นำเสนอเนื้อหารวบรวมจากข้อความเหล่านี้ในรูปแบบที่ สามารถประมวลผล เช่นสร้างแบบจำลองทางสถิติ ธรรมชาติ การประมวลผลภาษา ฯลฯ ., และ (c) จะ ใช้การ ข้อมูลในรูปแบบนำเสนอ, [3] [4] [5] ชุมชน[6] วิเคราะห์ความเชื่อมั่นนี้เป็น หลักการ วิธีใช้สำหรับการดึงข้อมูลความเชื่อมั่นและจากการประเมินผล แหล่งออนไลน์ แยกไม่เกลี้ย เป็นกลาง และ วัตถุประสงค์ของประโยคและข้อความจากประโยคตามอัตวิสัย แบกหนักรู้สึกเป็นงานที่ยากมาก อย่างไรก็ตาม มัน มีการสำรวจจริงจังที่เกี่ยวข้องอย่างใกล้ชิด แต่แยกต่างหาก ฟิลด์, (J. M. Wiebe, 1994) จะเน้นทำเป็นความแตกต่างระหว่าง 'ตามอัตวิสัย' และ 'วัตถุประสงค์' คำ และ ข้อความ บนมือหนึ่ง คนตามอัตวิสัยให้ประเมิน และ ความคิดเห็น ประสงค์จะใช้ แสดงข้อมูลที่เป็นจริง (J. Wiebe, Wilson อาร์ บรูซ ระฆัง และ มาร์ติน 2004) (J. Wiebe & Riloff, 2005) นี้ มีการวิเคราะห์ความเชื่อมั่นในในชุด เป็นภาษาที่จัดหน่วย โดยแต่ละประเภท วิเคราะห์ที่สองเหล่านี้ วิเคราะห์ subjectivity เน้นหาร หน่วยภาษาเป็นสองประเภท: วัตถุประสงค์ และตาม อัตวิสัย โดยพยายามแบ่งภาษาที่ใช้ในการวิเคราะห์ความเชื่อมั่น หน่วยเป็นประเภทสาม ลบ บวก และเป็นกลาง ที่ พื้นที่ของความเข้มข้นในบางช่วงการทำงานได้ด้วย subjectivity ตรวจเฉพาะ (J. M. Wiebe, 2000) ด้วยการ กาลเวลาและต้องเข้าใจ และ สกัด โมเมนตัมเพิ่มขึ้นช้า ๆ ต่อความเชื่อมั่น จัดประเภทและการวางแนวทางตรรก จัดส่วนเหลือของกระดาษดังนี้: ส่วนที่สอง นำเสนองานวิจัยที่เกี่ยวข้องของงานนำเสนอ ส่วน III อธิบายวิธีการนำเสนอ ด้วยขั้นตอนทั้งหมด ส่วน IVผลลัพธ์ และสุดท้าย V ส่วนสรุปข้อมูลสำคัญ นำเสนอวิธีการ
การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 2:[สำเนา]
คัดลอก!

ในปีที่ผ่านเวิลด์ไวด์เว็บได้กลายเป็นแหล่งสำคัญที่เกิดขึ้นใหม่และสารสนเทศ นี้เป็นเพราะการเจริญเติบโตอย่างรวดเร็วเนื่องจากการเพิ่มขึ้นของปรากฏการณ์ทางสังคมที่ติดต่อเครือข่ายฟอรั่มสนทนาออนไลน์, บล็อก, digitals ห้องสมุดและสตรีมมิ่งข่าวอย่างรวดเร็ว เนื้อหาเว็บในรูปแบบของข้อความที่ไม่มีโครงสร้างที่เป็นประโยชน์ในการตัดสินใจ. สกัดความรู้จากข้อความ suchonline เป็นสิ่งสำคัญมากสำหรับกลยุทธ์การตลาดการวางแผนและกระบวนการตัดสินใจ. KDT (ค้นพบความรู้ในตำรา) หรือการทำเหมืองข้อมูลข้อความหรือการทำเหมืองข้อความเงื่อนไขที่ใช้ในการทำเหมืองแร่ที่ไม่มีโครงสร้างหรือข้อมูลกึ่งโครงสร้าง มันเป็นอนุกรรมการวินัยใหม่เล็กน้อยจากข้อมูลการทำเหมืองแร่ที่จะพิจารณาข้อมูลเกี่ยวกับใจ ความจริงก็คือ "ข้อมูลที่เป็นข้อความการทำเหมืองแร่" เป็นรูปแบบคำศัพท์กลางวิวัฒนาการ [1] ได้โดยเริ่มต้นส่วนใหญ่ของข้อมูลออนไลน์เกี่ยวกับการทำเหมืองข้อมูลคือ"ความเข้าใจผิด" ดังกล่าวไม่ชัดเจน / ข้อมูลที่ทำให้เข้าใจผิดหมายถึงการทำเหมืองแร่ที่จะอุปมาที่ว่ามันเป็นเช่น"การสกัดนักเก็ตที่มีค่าของแร่จากหินไร้ค่าอย่างอื่น" ที่พบในหรือหา"inmountains ซ่อนทองของข้อมูลเกี่ยวกับใจ" ใน (D Orre et al. 1999) ลวด Cored Metallurgical มากขึ้น ความหมายแคบ ๆ ของสิ่งที่ข้อความการทำเหมืองแร่ไม่เป็นสิ่งจำเป็นที่จะแตกต่างจากIR แบบดั้งเดิมที่เป็นพื้น"การเข้าถึงข้อมูล" เป็นที่ถกเถียงกันอยู่โดยเฮิร์สต์[1]. ดึงของเอกสารที่เกี่ยวข้องกับความต้องการข้อมูลของผู้ใช้เป็นความกังวลหลักของแบบดั้งเดิม IR (อาจจะเป็นชื่อที่เหมาะสมมากขึ้นจะเป็นข้อมูลที่ดึง) อย่างไรก็ตามผู้ใช้ที่เหลืออยู่ของเขา / เธอเองที่จะหาข้อมูลที่ต้องการ. ในเอกสารที่ในความเห็นของเฮิร์สต์, การทำเหมืองข้อมูลยังไม่ได้กำกับเพียงการติดต่อกับข้อมูลแต่ ก็ยังพยายามที่จะค้นพบหรือรวบรวมรู้จักก่อนหน้านี้ข้อมูลจากข้อมูล(ข้อความ). ระดับภาษาที่แตกต่างกัน (คำประโยคและเอกสาร) การเน้นความแตกต่างที่สำคัญระหว่างเครื่องภายใต้การดูแลวิธีการเรียนรู้ที่พึ่งพาcorpora ข้อเขียนหรือคลังที่ใช้และใกล้ชิด / วิธีการ lexiconbased ในการจำแนกความเชื่อมั่น สามขั้นตอนหลักมีส่วนร่วมเสมอในขั้นตอนของการทำเหมืองข้อความและการจัดหมวดหมู่ความเชื่อมั่น; พวกเขาจะ (ก) การซื้อตำราที่เกี่ยวข้องกับพื้นที่ของความกังวลมักจะเรียกว่าIR นั้น (ข) นำเสนอเนื้อหาที่เก็บได้จากข้อความเหล่านี้ในรูปแบบที่สามารถดำเนินการได้เช่นการสร้างแบบจำลองทางสถิติธรรมชาติการประมวลผลภาษาฯลฯ .; และ (ค) จริงโดยใช้ข้อมูลในรูปแบบที่นำเสนอ[3] [4] ชุมชน [5] [6] วิเคราะห์ความเชื่อมั่นได้กลายเป็นที่โดดเด่นในขณะนี้วิธีการที่ใช้ในการสกัดความเชื่อมั่นและการประเมินจากแหล่งข้อมูลออนไลน์ แยกที่ไม่ดื้อดึงเป็นกลางและประโยควัตถุประสงค์และข้อความจากประโยคอัตนัยแบกความรู้สึกหนักเป็นงานที่ยากมาก แต่มันได้รับการสำรวจอย่างจริงจังในการแยกยังเกี่ยวข้องอย่างใกล้ชิดสนาม(JM วิบบ์, 1994) มันมุ่งเน้นที่การสร้างความแตกต่างระหว่าง'ส่วนตัว' และ 'วัตถุประสงค์' คำพูดและข้อความ; บนมือข้างหนึ่งคนอัตนัยการประเมินผลและให้ความคิดเห็นและที่อื่น ๆ คนที่มีวัตถุประสงค์จะใช้ในการนำเสนอข้อมูลซึ่งเป็นข้อเท็จจริง(เจวิบบ์, วิลสันอาร์บรูซ, เบลล์และมาร์ติน, 2004) (เจวิบบ์และ Riloff 2005) ซึ่งแตกต่างจากการวิเคราะห์ความเชื่อมั่นในเรื่องที่เกี่ยวกับชุดของประเภทเป็นที่หน่วยภาษาแยกตามแต่ละทั้งสองการวิเคราะห์ การวิเคราะห์ส่วนตัวมุ่งเน้นไปที่การแบ่งหน่วยภาษาเป็นสองประเภท: วัตถุประสงค์และอัตนัยในขณะที่วิเคราะห์ความเชื่อมั่นความพยายามที่จะแบ่งภาษาที่หน่วยออกเป็นสามประเภท; เชิงลบในเชิงบวกและเป็นกลาง พื้นที่ของความเข้มข้นในบางส่วนของงานแรกอยู่กับการตรวจจับผู้กระทำเท่านั้น (JM วิบบ์, 2000) ด้วยเนื้อเรื่องของเวลาและความจำเป็นในการเข้าใจและการสกัดแรงผลักดันที่เพิ่มขึ้นอย่างช้าๆ ต่อความเชื่อมั่นของการจัดหมวดหมู่และการวางแนวความหมาย. ส่วนที่เหลือของกระดาษที่มีการจัดดังนี้มาตรา-II นำเสนองานวิจัยที่เกี่ยวข้องของงานที่นำเสนอ มาตรา-III อธิบายถึงวิธีการที่นำเสนอกับทุกขั้นตอน มาตรา-IV ไฮไลท์ผลและในที่สุดก็มาตรา-V สรุปวิธีการที่นำเสนอ































































การแปล กรุณารอสักครู่..
ผลลัพธ์ (ไทย) 3:[สำเนา]
คัดลอก!
ใน ปี ล่าสุด เวิลด์ไวด์เว็บได้กลายเป็นแหล่งข้อมูลสำคัญ และเกิด

; นี้เป็นเพราะของการเจริญเติบโตอย่างรวดเร็วของการติดต่อจากปรากฏการณ์เครือข่ายทางสังคม
, ฟอรั่มการสนทนาออนไลน์ , บล็อก , ลาว
ห้องสมุดและรวดเร็วสตรีมมิ่งข่าว . เว็บเนื้อหา
ในรูปแบบของข้อความที่ไม่มีโครงสร้าง เป็นประโยชน์ในการตัดสินใจ
การสกัดความรู้จาก suchonline ข้อความสำคัญมาก
สำหรับกลยุทธ์การวางแผนการตลาดและกระบวนการตัดสินใจ
kdt ( การค้นพบความรู้ในตำรา ) หรือข้อความการทำเหมืองข้อมูลหรือ
การทำเหมืองข้อมูลเป็นคําที่ใช้ในเหมืองแห่งใหม่หรือ
ข้อมูลอย่างไร มันเป็นสาขาย่อยเล็กน้อยใหม่ข้อมูล
เหมืองแร่ที่พิจารณาข้อมูลต้นฉบับเดิม ความจริงก็คือว่า " ข้อมูลที่เป็นข้อความ
เหมืองแร่ " เป็นศัพท์กลางวิวัฒนาการรูปแบบ [ 1 ] .
ส่วนใหญ่ของข้อมูลออนไลน์เกี่ยวกับการทำเหมืองข้อมูลคือ
" เข้าใจผิด " เช่น ข้อมูลไม่ชัดเจน /
เข้าใจผิดบางเหมืองอุปมาว่า มันเป็นเหมือน " สกัด
มีค่า nuggets ของแร่จากหินอย่างไร้ค่า "
พบในหรือหา " ทองที่ซ่อนอยู่ inmountains ข้อมูล " ข้อความ
( D orre et al . 1999 )แคบมากขึ้นความหมายของสิ่งที่ข้อความ
เหมืองแร่ไม่ต้องแยกจาก IR แบบ
ซึ่งเป็น " การเข้าถึงข้อมูล " เป็นแย้งโดยเฮิร์ท
[ 1 ] กู้คืนเอกสารที่เกี่ยวข้องให้ข้อมูลความต้องการ
ของผู้ใช้เป็นกังวลหลักของ IR แบบดั้งเดิม ( บางที
ชื่อเหมาะสมกว่าจะสืบค้นข้อมูล ) ; อย่างไรก็ตามผู้ใช้ที่เป็นด้านซ้ายบนของเขา / เธอเองเพื่อค้นหาข้อมูลที่ต้องการ
ในเอกสาร ความคิดเห็นใน Hearst , data mining ได้
เพียงกำกับติดต่อกับข้อมูล แต่มันยัง
พยายามที่จะค้นพบหรือเก็บเกี่ยวที่ไม่รู้จักก่อนหน้านี้ข้อมูล
จากข้อมูล ( ข้อความ ) ระดับภาษาต่างกัน ( คำ ประโยค และเอกสาร

) เน้นความแตกต่างที่สำคัญระหว่างเครื่องมีวิธีการเรียน ที่ต้องพึ่งพา
บันทึกย่อหรือคลังข้อมูลคลังข้อมูลที่ใช้ และวิธีการในการ lexiconbased unsupervised / sentiment สามขั้นตอนหลัก
มักจะเกี่ยวข้องในกระบวนการของการทำเหมืองข้อมูลและ
หมวดหมู่ความเชื่อมั่น ; พวกเขาจะ ( 1 ) รับข้อความที่
ที่เกี่ยวข้องกับพื้นที่ของความกังวลมักจะเรียกว่า IR ( B )
;นำเสนอเนื้อหาที่รวบรวมได้จากข้อความเหล่านี้ในรูปแบบที่
สามารถประมวลผล เช่น การประมวลผลภาษาธรรมชาติ
การสร้างแบบจำลองทางสถิติ ฯลฯ และ ( c ) ใช้จริง
ข้อมูลในการนำเสนอรูปแบบ [ 3 ] [ 4 ] ชุมชน [ 5 ]
[ 6 ] การวิเคราะห์ความเชื่อมั่นได้ตอนนี้กลายเป็นเด่น
วิธีการสกัดอารมณ์และการประเมินผลจาก
แหล่งข้อมูลออนไลน์ ไม่ดื้อดึง แยก ,เป็นกลางและวัตถุประสงค์ ประโยค และข้อความจากอัตวิสัย

ถือประโยคความรู้สึกหนักเป็นงานยากมาก อย่างไรก็ตาม มีการสำรวจอย่างจริงจังใน

ยังแยกสาขาที่เกี่ยวข้องอย่างใกล้ชิด ( เจเอ็มวีเบอ , 1994 ) ซึ่งมุ่งเน้นการ
ความแตกต่างระหว่าง ' ' และ ' ' คำอัตนัยและวัตถุประสงค์
ข้อความ ; บนมือข้างหนึ่งที่ให้ประเมินและ
.
การแปล กรุณารอสักครู่..
 
ภาษาอื่น ๆ
การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.

Copyright ©2024 I Love Translation. All reserved.

E-mail: