SQL queries can be used to answer t

SQL queries can be used to answer this question: We want to look at which users are responsible for the most retweets, in descending order of most retweeted. However, querying Twitter data in a traditional RDBMS is inconvenient, since the Twitter Streaming API outputs tweets in a JSON format which can be arbitrarily complex. In the Hadoop ecosystem, the Hive project provides a query interface which can be used to query data that resides in HDFS. The query language looks very similar to SQL, but allows us to easily model complex types, so we can easily query the type of data we have. Seems like a good place to start. So how do we get Twitter data into Hive? First, we need to get Twitter data into HDFS, and then we’ll be able to tell Hive where the data resides and how to read it.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

สามารถใช้แบบสอบถาม SQL เพื่อตอบคำถามนี้: เราต้องการค้นหาซึ่งผู้รับผิดชอบมากที่สุดการทวีต เรียงลำดับของเจตสุด สอบถามข้อมูล Twitter ใน RDBMS ดั้งเดิมก็ไม่สะดวก ตั้งแต่การ Twitter API สตรีมผลทวีในรูปแบบ JSON ซึ่งอาจมีความซับซ้อนโดยพลการ ในระบบนิเวศ Hadoop โครงการกลุ่มให้ติดต่อสอบถามที่ใช้สอบถามข้อมูลที่อยู่ใน HDFS ภาษาสอบถามมีลักษณะคล้ายกับ SQL แต่ช่วยให้เราสามารถได้แบบชนิดที่ซับซ้อน ดังนั้นเราสามารถสอบถามได้ง่าย ๆ ชนิดของข้อมูลที่เรามี เหมือนเป็นจุดเริ่มต้นดี ดังนั้นวิธีใดเราจึงได้รับข้อมูล Twitter ในไฮฟ์ ครั้งแรก เราจำเป็นต้องได้รับข้อมูล Twitter ใน HDFS และจากนั้น เราจะสามารถบอกวิธีการอ่านและกลุ่มที่มีข้อมูลอยู่

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

แบบสอบถาม SQL สามารถใช้ในการตอบคำถามนี้: เราต้องการที่จะดูที่ผู้ใช้มีความรับผิดชอบใน retweets มากที่สุดเรียงลำดับจากมากที่สุด retweeted อย่างไรก็ตามการสอบถามข้อมูลในทวิตเตอร์แบบดั้งเดิม RDBMS ไม่สะดวกเนื่องจากทวิตเตอร์ Streaming API outputs ทวีตในรูปแบบ JSON ซึ่งสามารถที่ซับซ้อนโดยพลการ ในระบบนิเวศ Hadoop โครงการ Hive มีอินเตอร์เฟซแบบสอบถามซึ่งสามารถใช้ในการค้นหาข้อมูลที่อยู่ใน HDFS ภาษาแบบสอบถามที่มีลักษณะคล้ายกับ SQL แต่ช่วยให้เราได้อย่างง่ายดายแบบจำลองประเภทที่ซับซ้อนดังนั้นเราจึงสามารถสอบถามชนิดของข้อมูลที่เรามี ดูเหมือนว่าสถานที่ที่ดีที่จะเริ่มต้น ดังนั้นวิธีที่เราจะได้รับข้อมูลที่ทวิตเตอร์เข้ารัง? อันดับแรกเราต้องได้รับข้อมูลที่ทวิตเตอร์เข้า HDFS และจากนั้นเราจะสามารถที่จะบอก Hive ที่ข้อมูลที่อยู่และวิธีการที่จะอ่านมัน

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

แบบสอบถาม SQL สามารถใช้เพื่อตอบคำถามนี้เราต้องดูที่ผู้ใช้เป็นผู้รับผิดชอบ retweets มากที่สุด ตามลำดับของรีทวีตมากที่สุด อย่างไรก็ตาม การสอบถามข้อมูล Twitter ในแบบรูปไม่สะดวก เนื่องจาก Twitter Tweets ในรูปแบบ Streaming API โดย JSON ซึ่งสามารถสุ่มที่ซับซ้อน ในระบบนิเวศ Hadoop , โครงการไฮฟ์มีอินเตอร์เฟซแบบสอบถามที่สามารถใช้ในการค้นหาข้อมูลที่อยู่ใน hdfs . แบบสอบถามภาษามีลักษณะคล้ายกันมากกับ SQL , แต่ช่วยให้เราสามารถรูปแบบประเภทที่ซับซ้อน ดังนั้น เราสามารถค้นหาข้อมูลประเภทที่เรามี ดูเหมือนจะเป็นสถานที่ที่ดีที่จะเริ่มต้น แล้วเราจะได้รับข้อมูล Twitter ลงในรัง ? อย่างแรก เราต้องเอาข้อมูล Twitter เป็น hdfs แล้วเราจะบอกได้รังที่ข้อมูลอยู่และวิธีการอ่าน

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.