1. Introduction
Today, people and systems overload the web with an exponential
generation of huge amount of data. The amount of
data on the web is measured in exabytes (1018) and zettabytes
(1021). By 2025, the forecast is that the Internet will exceed
the brain capacity of everyone living in the whole world [1].
This fast growth of data is due to advances in digital sensors,
communications, computation, and storage that have
created huge collections of data.1 The term Big Data had been
coined, by Roger Magoulas (according to [2]), to describe this
phenomenon.
Seven recent papers (including [3] and [4]) have aimed to
extract Big Data trends, challenges and opportunities. [5] provide
a survey on scalable database management: updating
of heavy application, analytics and decision support. Likewise,
[6] study analytics in Big Data with a focus on data warehouse.
These two papers have different goals comparatively
to [7]. In a more rigorous way, M. Pospiech and C. Felden [7]
have selected relevant and recent papers which tackle different
aspects of Big Data and have clustered them in four
domains: Technical data provisioning (acquisition, storage, processing),
Technical data utilization (computation and time complexity),
Functional data provisioning (information life cycle
management, lean information management, value oriented
information management, etc.) and Functional data utilization
(realms where big data is used). At the end of their clustering,
[7] note that a lot of papers (87%) are technical and that
there is not any paper on functional data provisioning. More
closed (compared to the three previous works) to our target,
semantics in the age of Big Data, [8] focus on knowledge discovery
and management in Big Data era (flooding of data on
the web). As our paper they zoom on gathering relational
facts, information extraction, emergence of structure, etc. But
a deep circonscription of the concept of Big Data is not in the
scope of their article like some other key themes of this paper
like reasoning on large and uncertain OWL triples, coreference
resolution, ontology alignment. The last paper has been
authored by [9]. They present Big Data integration in a easyunderstandable-way.
Schema alignment, record linkage and data
fusion are presented w.r.t to Big Data characteristics (volume,
velocity and variety). Knowing the high value carried by data
in general and thus by Big Data, it is not surprising therefore
that Chief Information Officers (CIOs) are interested in it analytics
as technological. If initially web pages and traditional
databases were the raw materials respectively for search engine
companies and other businesses, now it has been mixed
1 http://www.cra.org/ccc/docs/init/Big_Data.pdf.
with large sets of miscellaneous, heterogeneous and unstructured
data. It implies that tools and techniques have to be designed
to disambiguate it before putting it together to master
and manage data of organizations. Our work is similar to [9]
in the approach. We discuss challenges and opportunities of
semantics in the age of Big Data and present the supply chain
to handle it. Therefore, this article defines Big Data (Section 2),
briefly discusses its management (Section 3) and finally tackles
Big Data and semantics challenges and opportunities (Section
4)
1. บทนำ
วันนี้คนและระบบเกินเว็บที่มีการชี้แจง
การสร้างข้อมูลจำนวนมาก จำนวนของ
ข้อมูลบนเว็บเป็นวัดในเอ็กซาไบต์ (1018) และ zettabytes
(1021) ปี 2025 คาดการณ์ว่าอินเทอร์เน็ตจะเกิน
ความจุของสมองของทุกคนที่อาศัยอยู่ในโลกทั้งโลก [1].
นี้เจริญเติบโตอย่างรวดเร็วของข้อมูลเป็นเพราะความก้าวหน้าในการเซ็นเซอร์ดิจิตอล,
การสื่อสาร, การคำนวณและการจัดเก็บข้อมูลที่มีการ
สร้างคอลเลกชันขนาดใหญ่ของ data.1 คำว่าข้อมูลขนาดใหญ่ได้รับการ
ประกาศเกียรติคุณโดยโรเจอร์ Magoulas (ตาม [2]) เพื่ออธิบายเรื่องนี้
ปรากฏการณ์.
เซเว่นเอกสารที่ผ่านมา (รวมถึง [3] และ [4]) มีวัตถุประสงค์เพื่อ
ดึงข้อมูลขนาดใหญ่แนวโน้มความท้าทายและ โอกาส [5] ให้
แบบสำรวจเกี่ยวกับการจัดการฐานข้อมูลที่ปรับขนาดได้ที่: การปรับปรุง
ของโปรแกรมหนักการวิเคราะห์และการสนับสนุนการตัดสินใจ ในทำนองเดียวกัน
[6] การวิเคราะห์การศึกษาข้อมูลขนาดใหญ่ที่มีความสำคัญในคลังข้อมูล.
เหล่านี้สองเอกสารมีเป้าหมายที่แตกต่างกันเมื่อเทียบกับ
การ [7] ในทางที่เข้มงวดมากขึ้น, M. Pospiech และซี [7] Felden
ได้เลือกเอกสารที่เกี่ยวข้องและเมื่อเร็ว ๆ นี้ซึ่งจะแก้ไขปัญหาที่แตกต่างกัน
ในด้านของข้อมูลขนาดใหญ่และมีการกระจุกตัวพวกเขาในสี่
โดเมน: เทคนิคการจัดเตรียมข้อมูล (ซื้อ, การจัดเก็บประมวลผล)
ข้อมูลทางเทคนิค การใช้ประโยชน์ (คำนวณและความซับซ้อนเวลา),
การจัดเตรียมข้อมูลการทำงาน (ข้อมูลวงจรชีวิตของ
การจัดการการจัดการข้อมูลยันมูลค่าเชิง
การจัดการข้อมูลและอื่น ๆ ) และการใช้ประโยชน์ข้อมูลการทำงาน
(อาณาจักรที่ข้อมูลขนาดใหญ่จะใช้) ในตอนท้ายของการจัดกลุ่มของพวกเขา,
[7] ทราบว่ามีเอกสารจำนวนมาก (87%) ส่วนทางด้านเทคนิคและว่า
ไม่มีกระดาษใด ๆ เกี่ยวกับการจัดเตรียมข้อมูลการทำงาน เพิ่มเติม
ปิด (เมื่อเทียบกับสามผลงานก่อนหน้านี้) เพื่อกำหนดเป้าหมายของเรา
ความหมายในยุคของข้อมูลขนาดใหญ่ [8] มุ่งเน้นในการค้นพบความรู้
และการจัดการในยุคข้อมูลขนาดใหญ่ (น้ำท่วมของข้อมูลบน
เว็บ) ในฐานะที่เป็นกระดาษของเราพวกเขาซูมในการรวบรวมสัมพันธ์
ข้อเท็จจริงสกัดข้อมูล, การเกิดขึ้นของโครงสร้าง ฯลฯ แต่
circonscription ลึกของแนวคิดของข้อมูลขนาดใหญ่ไม่ได้อยู่ใน
ขอบเขตของบทความของพวกเขาเช่นบางรูปแบบอื่น ๆ ที่สำคัญของบทความนี้
เช่นเหตุผลในขนาดใหญ่และ อเนกประสงค์นกฮูกมีความไม่แน่นอน coreference
ละเอียดการจัดแนวอภิปรัชญา กระดาษที่ผ่านมาได้รับการ
ประพันธ์โดย [9] พวกเขานำเสนอการรวมข้อมูลขนาดใหญ่ใน easyunderstandable ทาง.
Schema จัดตำแหน่งการเชื่อมโยงและบันทึกข้อมูล
WRT ฟิวชั่นจะถูกนำเสนอลักษณะข้อมูลขนาดใหญ่ (ปริมาณ,
ความเร็วและความหลากหลาย) รู้ที่มีมูลค่าสูงที่ดำเนินการโดยข้อมูล
ทั่วไปและดังนั้นจากข้อมูลขนาดใหญ่ก็ไม่น่าแปลกใจจึง
ว่าเจ้าหน้าที่ข้อมูลหัวหน้า (ซีไอโอ) มีความสนใจในมันวิเคราะห์สถิติ
เป็นเทคโนโลยี หากหน้าเว็บแรกและแบบดั้งเดิม
ฐานข้อมูลเป็นวัตถุดิบตามลำดับสำหรับเครื่องมือค้นหาของ
บริษัท และธุรกิจอื่น ๆ ตอนนี้มันได้รับการผสม
1 http://www.cra.org/ccc/docs/init/Big_Data.pdf.
กับชุดใหญ่ของ เบ็ดเตล็ดต่างกันและไม่มีโครงสร้าง
ข้อมูล มันแสดงให้เห็นว่าเครื่องมือและเทคนิคที่ต้องได้รับการออกแบบมา
เพื่อให้กระจ่างก่อนที่จะวางไว้ร่วมกันเพื่อต้นแบบ
และจัดการข้อมูลขององค์กร การทำงานของเราก็คล้าย ๆ กับ [9]
ในแนวทาง เราจะหารือถึงความท้าทายและโอกาสของ
ความหมายในยุคของข้อมูลขนาดใหญ่และนำเสนอห่วงโซ่อุปทาน
จะจัดการกับมัน ดังนั้นบทความนี้กำหนดข้อมูลขนาดใหญ่ (ส่วนที่ 2)
สั้น ๆ ถึงการบริหารจัดการ (มาตรา 3) และในที่สุดก็โหม่ง
ข้อมูลขนาดใหญ่และความหมายความท้าทายและโอกาส (มาตรา
4)
การแปล กรุณารอสักครู่..