• Crowdsourcing used to collect dat

• Crowdsourcing used to collect data and/or features and
metadata to enhance the current semantics of data.
• Text analytics which aims to analyze large text collections
(email, web pages, etc.) to extract information. It is used
for topics modeling, question answering, etc.
Some proposals emphasize that those techniques rely on a
generalized picture of the underlying knowledge. Due to their
design they fail to capture the subtleties of the processes
which produce these data [33,34]. Moreover, these techniques
sometimes behave badly with very large datasets. It is the
case for example of learning-based techniques. There, size of
training data can exceed memory or the fast growing number
of features can lead to a high execution time. Sengamedu [35]
presents some scalable methods which can be applied for
machine learning (Random Projections, Stochastic Gradient
Descent and MinClosed sequences). Trends about big data
analytics are summarized within [31]. They mainly concern
visualization of multi-form, multi-source and real-time data.
Moreover, the size of data limits in-memory processing.
3.3. Adding Big Data capability to an existing information
system
A whole book can be written on this topic. It is what had
been done by [3] by the study of data warehousing in the
age of Big Data. A number of strategies of this integration
are presented in Table 1. The first step of that integration is
about data acquisition. Since traditional databases have to
deal with structured data, existing ecosystem needs to be
extended across all of the data types and domains. Then,
data integration capability needs to deal with velocity and
frequency. The challenge here is also about ever growing
volume and, because many technologies leverage Hadoop, use
technologies that allow you to interact with Hadoop in a bidirectional
manner: load and store data (HDFS) and process
and reuse the output (MapReduce) for further processing.
[14, page 12] reminds us that the main challenge is not to
build “that is ideally suited for all processing tasks” but to
have an underlying architecture flexible enough to permit to
processes built on top to work at their full potential. For sure
there is not a commonly agreed solution, an infrastructure is
intimately tied to the purpose of the organization in which
it is used and consequently to the kind of integration (realtime
or batch). More and other important questions have to
be answered: are Big Data stored timeliness or not [4]?

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

• Crowdsourcing ที่ใช้ในการเก็บรวบรวมข้อมูลหรือคุณสมบัติ และข้อมูลเมตาเพื่อเพิ่มความหมายของปัจจุบันของข้อมูล•การวิเคราะห์ข้อความที่วิเคราะห์คอลเลกชันของข้อความขนาดใหญ่(อีเมล หน้าเว็บ ฯลฯ) ในการดึงข้อมูล มีใช้สำหรับหัวข้อการสร้างโมเดล ถามตอบ ฯลฯข้อเสนอบางอย่างเน้นเทคนิคที่ใช้ในการรูปภาพทั่วไปความรู้พื้นฐาน เนื่องจากพวกเขาพวกเขาล้มเหลวในการจับภาพรายละเอียดปลีกย่อยของกระบวนการออกแบบซึ่งผลิตข้อมูลเหล่านี้ [33,34] นอกจากนี้ เทคนิคเหล่านี้บางครั้งทำตัวไม่ดีกับชุดข้อมูลขนาดใหญ่มาก มันเป็นการกรณีตัวอย่างเช่นของเทคนิคที่ใช้การเรียนรู้ มี ขนาดของข้อมูลการฝึกอบรมสามารถเกินหน่วยความจำหรือจำนวนที่เพิ่มขึ้นอย่างรวดเร็วคุณสมบัติสามารถนำไปสู่เวลาการดำเนินการสูง Sengamedu [35]แสดงวิธีการบางอย่างปรับได้ซึ่งสามารถใช้สำหรับเครื่องเรียน (สุ่มคาดการณ์ Stochastic ไล่ระดับสีเชื้อสายและ MinClosed ลำดับ) แนวโน้มเกี่ยวกับข้อมูลวิเคราะห์จะสรุปภายใน [31] พวกเขาส่วนใหญ่เป็นกังวลแสดงข้อมูลหลายรูปแบบ หลายแหล่ง และแบบเรียลไทม์นอกจากนี้ ขนาดของข้อมูลที่จำกัดการประมวลผลในหน่วยความจำ3.3 การเพิ่มข้อมูลขนาดใหญ่สามารถเป็นข้อมูลที่มีอยู่ระบบหนังสือทั้งหมดที่สามารถเขียนในหัวข้อนี้ มันเป็นอะไรได้การทำ โดย [3] โดยการศึกษาข้อมูลการจัดการคลังสินค้าในการอายุของข้อมูลขนาดใหญ่ จำนวนกลยุทธ์ของการรวมจะแสดงในตารางที่ 1 ขั้นตอนแรกของรวมที่มีเกี่ยวกับการเก็บข้อมูล เนื่องจากฐานข้อมูลดั้งเดิมจัดการกับโครงสร้างข้อมูล ระบบนิเวศที่มีอยู่ต้องมีขยายทั้งหมดของชนิดข้อมูลและโดเมน แล้วความสามารถในการรวมข้อมูลต้องมีความเร็ว และความถี่ ความท้าทายที่นี่ยังเป็นเรื่องเคยเติบโตเสียง และ เนื่องจากเทคโนโลยีต่าง ๆ ใช้ Hadoop ใช้เทคโนโลยีที่ช่วยให้คุณสามารถโต้ตอบกับ Hadoop ในสองทิศทางลักษณะ: โหลด และเก็บข้อมูล (HDFS) และกระบวนการและนำผลผลิต (MapReduce) งาน[หน้า 14, 12] เตือนเราว่า ความท้าทายหลักไม่ถึงสร้าง "เป็นที่เหมาะสำหรับงานประมวลผลทั้งหมด" แต่การมีความยืดหยุ่นเพียงพอที่จะอนุญาตให้สถาปัตยกรรมพื้นฐานกระบวนการที่สร้างขึ้นบนการทำงานที่เต็มศักยภาพ แหงอยู่แล้วไม่มีการแก้ไขปัญหาที่ตกลงกัน มีโครงสร้างพื้นฐานอย่างใกล้ชิดกับวัตถุประสงค์ขององค์กรที่การใช้ และจากนั้นในการชนิดของการรวม (เรียลไทม์หรือชุด) คำถามที่สำคัญมากขึ้น และมีการตอบ: มีข้อมูลเก็บไว้ทันเวลา หรือไม่ [4]

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

• Crowdsourcing ใช้ในการเก็บรวบรวมข้อมูลและ / หรือคุณสมบัติและ
ข้อมูลเมตาเพื่อเพิ่มความหมายในปัจจุบันของข้อมูล.
•การวิเคราะห์ข้อความซึ่งมีวัตถุประสงค์เพื่อวิเคราะห์คอลเลกชันข้อความขนาดใหญ่
(อีเมล, หน้าเว็บ, ฯลฯ ) เพื่อดึงข้อมูล มันถูกใช้
สำหรับหัวข้อการสร้างแบบจำลองการตอบคำถาม ฯลฯ
ข้อเสนอบางอย่างเน้นว่าเทคนิคเหล่านั้นพึ่งพา
ภาพทั่วไปของความรู้พื้นฐาน เนื่องจากพวกเขา
ออกแบบพวกเขาล้มเหลวในการจับภาพรายละเอียดปลีกย่อยของกระบวนการที่
ซึ่งผลิตข้อมูลเหล่านี้ [33,34] นอกจากนี้เทคนิคเหล่านี้
บางครั้งประพฤติมิชอบกับชุดข้อมูลขนาดใหญ่มาก มันเป็น
กรณีตัวอย่างของเทคนิคการเรียนรู้ตาม มีขนาดของ
ข้อมูลการฝึกอบรมสามารถเกินหน่วยความจำหรือตัวเลขการเติบโตอย่างรวดเร็ว
ของคุณสมบัติที่สามารถนำไปสู่การดำเนินการเป็นเวลาสูง Sengamedu [35]
นำเสนอวิธีการขยายขีดความสามารถบางอย่างที่สามารถนำมาใช้สำหรับ
การเรียนรู้เครื่อง (ประมาณการสุ่ม Stochastic ไล่โทนสี
โคตรและ MinClosed ลำดับ) แนวโน้มเกี่ยวกับข้อมูลขนาดใหญ่
การวิเคราะห์สรุปได้ภายใน [31] พวกเขาส่วนใหญ่กังวล
ภาพของหลายรูปแบบหลายแหล่งที่มาและข้อมูลในเวลาจริง.
นอกจากนี้ขนาดของข้อ จำกัด ของการประมวลผลข้อมูลในหน่วยความจำ.
3.3 การเพิ่มความสามารถในข้อมูลขนาดใหญ่ไปยังข้อมูลที่มีอยู่ใน
ระบบ
หนังสือทั้งสามารถเขียนในหัวข้อนี้ มันเป็นสิ่งที่ได้
รับการดำเนินการโดย [3] โดยการศึกษาของคลังข้อมูลในส่วน
อายุของข้อมูลขนาดใหญ่ จำนวนของกลยุทธ์ของการรวมกลุ่มกับ A
ถูกแสดงไว้ในตารางที่ 1 ขั้นตอนแรกของการรวมกลุ่มที่เป็น
เรื่องเกี่ยวกับการเก็บข้อมูล เนื่องจากฐานข้อมูลแบบดั้งเดิมจะต้อง
จัดการกับข้อมูลที่มีโครงสร้างระบบนิเวศที่มีอยู่จะต้องมีการ
ขยายในทุกชนิดของข้อมูลและโดเมน จากนั้น
ความสามารถในการรวมข้อมูลความต้องการที่จะจัดการกับความเร็วและ
ความถี่ ความท้าทายที่นี่ยังเป็นเรื่องที่เคยเติบโต
ปริมาณและเพราะหลายเทคโนโลยีการใช้ประโยชน์จาก Hadoop ใช้
เทคโนโลยีที่ช่วยให้คุณสามารถโต้ตอบกับ Hadoop ในสองทิศทาง
ลักษณะ: โหลดและการจัดเก็บข้อมูล (HDFS) และขั้นตอน
และนำมาใช้เอาท์พุท (MapReduce) สำหรับการประมวลผลต่อไป .
[14 หน้า 12] เตือนเราว่าความท้าทายที่สำคัญคือไม่
สร้าง "ที่เหมาะสำหรับการประมวลผลงานทุกคน" แต่
มีสถาปัตยกรรมต้นแบบที่มีความยืดหยุ่นพอที่จะอนุญาตให้มี
กระบวนการที่สร้างขึ้นบนการทำงานที่เต็มศักยภาพ เพื่อตรวจสอบว่า
มีไม่ได้เป็นวิธีการแก้ปัญหาที่ตกลงกันโดยทั่วไปโครงสร้างพื้นฐานที่มีการ
เชื่อมโยงอย่างใกล้ชิดกับวัตถุประสงค์ขององค์กรที่
มีการใช้งานและส่งผลกับชนิดของการรวมกลุ่ม (เรียลไทม์
หรือชุด) มากขึ้นและคำถามที่สำคัญอื่น ๆ ได้ที่จะ
ได้รับการตอบ: จะมีข้อมูลขนาดใหญ่ที่เก็บไว้ทันเวลาหรือไม่ [4]

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.