Sina Weibo is one of the major micro-blogging services in China. According to a recent news report, Weibo has over 300 million users, and 100 million posts are generated everyday. In contrast with its counterpart in the West, a large number of studies on Twitter has been done, but the number of studies on Weibo is rather limited. Some researchers are constrained in studying Weibo because of language issues. For those who are sufficient in Chinese language, the research that has been done is mostly qualitative case studies. Thus, the question posed here is how to conduct large scale quantitative analysis of Chinese Weibo?
In comparison with qualitative case studies, large scale quantitative analysis on Chinese Weibo are limited because of the restrictions of Sina API to retrieve the data.The article on Chinese censorship by Bamman and others used the public timeline to retrieve the stream of Weibo posts. According to the Sina public timeline document, it returns the most recent 20 public posts. However, for researchers, it is still unknown if this 20 posts are representative to the larger Weibo posts set. Another approach is to fetch posts through users’ ID. WeiboScope, a project at Hong Kong University, has archives of posts from over 300 thousands users who have at least 1000 followers. During their presentation at the 10th Chinese Internet Research Conference, they showed their approach to the issue of censorship: they retrieve these users’ statuses every day, and compare to their archive to determine which posts are deleted. Another tool to retrieve Weibo data I tried is DiscoverText, in which users can set up their words to search, and searching time intervals, and the tool will return posts containing the words. Using both tools, I did a search of posts containing the word “Wukan (乌坎)” sent from March 23 to March 27. WeiboScope returned me around 200 items while DiscoverText fetched around 1000 items. I am not quite sure about the reasons for the distinctive results, but my guess is that one only looks at popular users’ posts while the other fetches from the general public timeline.
Despite these restrictions, I still think the chances of conducting large scale quantitative research on Chinese Weibo lie in the refinement of the research questions. The limited sample set can still be representative to the limited scope of the questions. Specifically, instead of asking about the frequencies of certain key words appearing on all the Weibo posts, researchers can shift their perspective to a limited scope that only focuses on an interesting group. For example, Weibo provides lists of users in different occupations, and if the research questions only relate to posts produced by a certain type of users, such as journalists, researchers can directly make use of the list.
Following this idea, Wei Wei and I have been working on a project mapping out the NGO networks on Weibo. The figure above shows who mentions whom among NGOs on Weibo. The node size is the in-degree centrality and the colors show different communities. The NGOs are largely clustered by their working domains such as saving animals and evironment protection. Large NGOs, for example, WWF, UNICEF and China Foundation Center are frequently mentioned by other NGOs on Weibo. We are still in the process of collecting data and especially welcome any suggestions on data scraping on Weibo and network analysis methods. The broader topic of NGO networks we are interested in is how the social media empowers grassroots NGOs. Resources for media coverage from mainstream media on grassroots NGOs are limited because they cannot compete with government affiliated NGOs for media attention, so we contend their integrated use of social media may amplify their voices and construct a network that challenges the offline hierarchical positions. Although the figure above shows large international organizations occupy key positions in the network, we might also look into dynamic data to see the change of the structures instead of this static picture
Sina Weibo เป็นหลักบริการไมโครบล็อกในจีน ตามรายงานข่าวล่าสุด , Weibo ได้กว่า 300 ล้านผู้ใช้ , และ 100 ล้านข้อความถูกสร้างขึ้นทุกวัน ในทางตรงกันข้ามกับที่คล้ายกันในเวสต์ , จํานวนของการศึกษาใน Twitter ได้ แต่จำนวนของการศึกษาใน Weibo ค่อนข้างจำกัดนักวิจัยบางคนมีข้อ จำกัด ในการศึกษา เวยปั๋ว เพราะปัญหาเรื่องภาษา สำหรับผู้ที่มีเพียงพอในภาษาจีน งานวิจัยที่ได้ทำกรณีศึกษาส่วนใหญ่เป็นเชิงคุณภาพ ดังนั้น คำถามที่เกิดที่นี่เป็นวิธีการที่จะนำขนาดใหญ่การวิเคราะห์จีน Weibo ?
ในการเปรียบเทียบกับเชิงคุณภาพกรณีศึกษาขนาดใหญ่ปริมาณวิเคราะห์ในจีน Weibo จะถูก จำกัด เนื่องจากข้อ จำกัด ของ Sina API เพื่อดึงข้อมูล บทความเกี่ยวกับจีนการเซ็นเซอร์โดย bamman และอื่น ๆใช้ระยะเวลาสาธารณะเพื่อเรียกกระแสของ Weibo โพสต์ ตามการ Sina สาธารณะระยะเวลาเอกสาร ผลตอบแทนล่าสุด 20 สาธารณะโพสต์ อย่างไรก็ตาม สำหรับนักวิจัยก็ยังไม่ทราบ ถ้า 20 โพสต์เป็นตัวแทนให้ใหญ่ขึ้น Weibo โพสต์ตั้ง อีกวิธีหนึ่งคือเอาโพสต์ผ่าน ID ของผู้ใช้ weiboscope , โครงการที่มหาวิทยาลัยฮ่องกง มีจดหมายเหตุของโพสต์จากกว่า 300 ผู้ใช้นับพันที่มีอย่างน้อย 1 , 000 คน ในระหว่างการนำเสนอของพวกเขาที่ 10 อินเทอร์เน็ตจีนวิจัยการประชุมพวกเขาพบวิธีการของพวกเขาในเรื่องของการเซ็นเซอร์ : พวกเขาเรียกสถานะของผู้ใช้เหล่านี้ทุก ๆวัน และเปรียบเทียบกับการจัดเก็บเพื่อตรวจสอบที่โพสต์จะถูกลบออก อีกเครื่องมือในการดึงข้อมูลที่ผมพยายามจะ discovertext เวยป๋อ ซึ่งผู้ใช้สามารถตั้งค่าคำเพื่อค้นหา และการค้นหาช่วงเวลาและเครื่องมือจะกลับมาโพสต์ที่มีคำ ใช้ทั้งสองมือผมค้นหาข้อความที่มีคำว่า " อูข่าน ( 乌坎 ) " ส่งจาก 23 มีนาคม 27 มีนาคม weiboscope กลับมาฉันประมาณ 200 รายการ ในขณะที่ discovertext ใช้ประมาณ 1 , 000 รายการ ผมไม่แน่ใจว่าเกี่ยวกับเหตุผลที่โดดเด่น แต่ฉันเดาว่าดูเฉพาะโพสต์ของผู้ใช้อื่น ๆที่เป็นที่นิยมในขณะที่การดึงข้อมูลจากระยะเวลาสาธารณะทั่วไป
แม้จะมีข้อ จำกัด เหล่านี้ผมยังคิดว่าโอกาสของการขนาดใหญ่ การวิจัยเชิงปริมาณในจีน Weibo โกหกในการปรับแต่งของการวิจัย คำถาม ชุดตัวอย่างจำกัดยังเป็นตัวแทนเพื่อจำกัดขอบเขตของคำถาม โดยเฉพาะ แทนที่จะถามเกี่ยวกับความถี่ของคำที่ปรากฏในบางคีย์ทั้งหมดโพสต์ Weibo ,นักวิจัยสามารถเปลี่ยนมุมมองของพวกเขาเพื่อจำกัดขอบเขตที่เน้นกลุ่มที่น่าสนใจ ตัวอย่างเช่น Weibo มีรายชื่อผู้ใช้ในอาชีพที่แตกต่างกัน และถ้าการวิจัยแค่คำถามที่เกี่ยวข้องกับบทความที่ผลิตโดยบางประเภทของผู้ใช้ เช่น นักข่าว นักวิจัยโดยตรงสามารถใช้ประโยชน์จากรายการ
ตามความคิดนี้เว่ย เว่ย และฉันได้ทำงานในโครงการสร้างเครือข่ายองค์กรพัฒนาเอกชนใน Weibo . รูปข้างบนแสดงที่กล่าวถึงใครในหมู่องค์กรพัฒนาเอกชนใน Weibo . โหนดในระดับขนาดและสีที่แสดงความเป็นศูนย์กลางชุมชนที่แตกต่างกัน องค์กรส่วนใหญ่จะเป็นกลุ่มโดยโดเมนทำงานของพวกเขาเช่นประหยัดสัตว์และการป้องกัน evironment . เอ็นจีโอขนาดใหญ่ ตัวอย่างเช่น ร่วมกับยูนิเซฟและมูลนิธิศูนย์จีนมักกล่าวโดยองค์กรพัฒนาเอกชนอื่นๆ ใน Weibo . เรากำลังอยู่ในกระบวนการของการรวบรวมข้อมูล โดยเฉพาะข้อมูลและยินดีต้อนรับข้อเสนอแนะใด ๆขูดบน Weibo และวิธีการวิเคราะห์เครือข่าย หัวข้อที่กว้างขึ้นของเครือข่ายเอ็นจีโอที่เราสนใจเป็นวิธีการสื่อสังคมช่วยให้รากหญ้า NGOsทรัพยากรสำหรับการรายงานข่าวจากสื่อกระแสหลักในองค์กรพัฒนาเอกชนระดับรากหญ้าจะถูก จำกัด เพราะพวกเขาไม่สามารถแข่งขันกับรัฐบาลสังกัดองค์กรพัฒนาเอกชนเพื่อความสนใจของสื่อเพื่อให้เรายืนยันการบูรณาการการใช้สื่อสังคมอาจขยายเสียงของพวกเขาและสร้างเครือข่ายที่ท้าทายครับลำดับชั้นตำแหน่งแม้ว่าตัวเลขข้างต้นแสดงให้เห็นถึงองค์กรระหว่างประเทศขนาดใหญ่ครอบครองตำแหน่งสำคัญในเครือข่าย เราอาจจะยังดูเป็นข้อมูลแบบไดนามิกที่จะเห็นการเปลี่ยนแปลงของโครงสร้างแทนรูปแบบนี้
การแปล กรุณารอสักครู่..
