Application to Sociolinguistics
Language contact has been a hot issue in lin-
guistics since the publication of Languages in
contact (Weinreich, 1953) and represents one
of the most common scenarios for the study
of language variation and change, including
code-switching (CS). In informal communi-
cation, CS is a pervasive phenomenon by
which multilingual speakers switch back and
forth between their languages. CS is present
at the inter-sentential, intra-sentential and
even morphological levels. The system pre-
sented in this paper could be applied to CS to
unveil part of the underlying sociolinguistic
structure of communities and, at the same
time, when this structure is known in ad-
vance, it can also be used to evaluate the
predictive power of the method used by the
system. In the case of the Iberian Penin-
sula, it is the westernmost southern Euro-
pean peninsula separated from the rest of
Europe at the north-east edge by the Pyre-
nees. In the Iberian Peninsula, the six top
languages found in tweets are Basque, Cata-
lan, Galician, Spanish, Portuguese and En-
glish. Except for English, which is a global
language, and Basque, which is a language
isolate, the rest of Iberian languages descend
from Vulgar Latin spoken in the Peninsula.
Spain has an official language, Castilian (also
known as Spanish) but the central govern-
ment has transferred some of its powers to
regional governments, known as autonomous
communities, some of them having co-official
languages. Table 5 contains two matrices
with the number of pairs of languages cooc-
curring in tweets. Table 5.a is computed
using the manually labeled examples of the
training and test datasets while Table 5.b is
computed from the predictions on the test
dataset. There are four identifiable blocks in
those matrices: (1) English (en), which is a
global language, and cooccurs with the rest
of languages; (2) Portuguese (pt), which is
a national language with little contact with
Spanish; (3) Spanish (es) a national lan-
guage cooccurring with the Spain’s co-official
languages: Catalan (ca), Galician (gl) and
Basque (eu); and (4) the block of the co-
officials, which are not seen together in tweets
because they are not languages in contact.
ภาษาศาสตร์ประยุกต์ใช้ในการติดต่อภาษาที่ได้รับเป็นประเด็นร้อนใน lin- guistics ตั้งแต่การพิมพ์ของภาษาในการติดต่อ(Weinreich, 1953) และเป็นหนึ่งในสถานการณ์ที่พบมากที่สุดสำหรับการศึกษาของการเปลี่ยนแปลงของภาษาและการเปลี่ยนแปลงรวมทั้งรหัสสลับ(CS) . ในการสื่อสารทางการไอออนบวกงานเป็นปรากฏการณ์ที่แพร่หลายโดยที่ลำโพงพูดได้หลายภาษาสลับไปมาระหว่างภาษาของพวกเขา บริการลูกค้าที่เป็นปัจจุบันในระหว่าง sentential, ภายใน sentential และแม้ระดับก้าน ระบบก่อนsented ในบทความนี้อาจจะนำไปใช้กับลูกค้าที่จะเปิดตัวเป็นส่วนหนึ่งของsociolinguistic พื้นฐานโครงสร้างของชุมชนและที่เดียวกันเวลาเมื่อโครงสร้างนี้เป็นที่รู้จักกันในปรับแก้สแวนซ์ก็ยังสามารถนำมาใช้ในการประเมินอำนาจการพยากรณ์วิธีการที่ใช้โดยระบบ ในกรณีของไอบีเรีย Penin- ซูลามันเป็นทางตอนใต้ของยูโรตะวันตกคาบสมุทร Pean แยกออกจากส่วนที่เหลือของยุโรปที่ขอบภาคตะวันออกเฉียงเหนือโดยPyre- โจร ในคาบสมุทรไอบีเรีหกด้านบนภาษาที่พบในทวิตเตอร์มีบาสก์ Cata- ลาน, กาลิเซีย, สเปน, โปรตุเกสและดิจิตอลซูมไทย ยกเว้นภาษาอังกฤษซึ่งเป็นระดับโลกภาษาและบาสก์ซึ่งเป็นภาษาที่แยกส่วนที่เหลือของภาษาไอบีเรียลงมาจากสัปดนละตินพูดในคาบสมุทร. สเปนมีภาษาราชการ Castilian (ยังเป็นที่รู้จักกันเป็นสเปน) แต่กลางควบคุม - ment ได้โอนบางส่วนของอำนาจในการที่รัฐบาลในภูมิภาคที่เรียกว่าอิสระชุมชนบางส่วนของพวกเขาต้องร่วมอย่างเป็นทางการภาษา ตารางที่ 5 มีสองเมทริกซ์ที่มีจำนวนของคู่ภาษาcooc- curring ในทวิตเตอร์ 5. ตารางคำนวณโดยใช้ตัวอย่างที่มีข้อความด้วยตนเองของการฝึกอบรมและการทดสอบในขณะที่ชุดข้อมูลตาราง5.b จะคำนวณจากการคาดการณ์ในการทดสอบชุด มีสี่บล็อกที่สามารถระบุตัวในที่มีการฝึกอบรมผู้ที่ (1) English (en) ซึ่งเป็นภาษาทั่วโลกและcooccurs กับส่วนที่เหลือของภาษา (2) โปรตุเกส (PT) ซึ่งเป็นภาษาประจำชาติที่มีการติดต่อกับสเปน (3) สเปน (e) ต่อ lan- ชาติวัดcooccurring กับของสเปนร่วมอย่างเป็นทางการภาษาคาตาลัน(CA), กาลิเซีย (GL) และบาสก์(eu); และ (4) บล็อกของร่วมเจ้าหน้าที่ที่ไม่ได้เห็นกันในทวิตเตอร์เพราะพวกเขาไม่ได้ภาษาในการติดต่อ
การแปล กรุณารอสักครู่..

การประยุกต์ใช้ภาษาศาสตร์สังคม
ภาษาติดต่อ ได้เป็นประเด็นร้อนในหลิน -
guistics ตั้งแต่สิ่งพิมพ์ของภาษาใน
ติดต่อ ( weinreich , 1953 ) และเป็นหนึ่งในสถานการณ์ที่พบบ่อยที่สุด
เพื่อศึกษาการแปรเปลี่ยนภาษา รวมทั้ง
โค้ดเปลี่ยน ( CS ) ในระบบการสื่อสาร -
ไอออนบวก , CS เป็นปรากฏการณ์ที่แพร่หลายโดย
ลำโพงเปลี่ยนกลับไป
พูดได้หลายภาษาไปมาระหว่างภาษาของพวกเขา CS เป็นปัจจุบัน
ที่ อินเตอร์ sentential , ภายใน sentential
แม้แต่ลักษณะและระดับ ระบบ pre -
sented ในกระดาษนี้สามารถใช้กับ CS
เปิดเผยส่วนหนึ่งของต้นแบบภาษา
โครงสร้างของชุมชน และในเวลาเดียวกัน
เมื่อโครงสร้างเป็นที่รู้จักในโฆษณา -
แวนซ์ มันยังสามารถใช้เพื่อประเมินความสามารถของวิธีที่ใช้
โดยระบบ ในกรณีของไอบีเรีย penin -
ซูลา เป็นซึ่งอยู่ไกลที่สุดทางทิศตะวันตกภาคใต้ยูโร -
เป็นคาบสมุทรที่แยกออกจากส่วนที่เหลือของยุโรปในภาคตะวันออกเฉียงเหนือ
-
ของขอบโดยกอง . ในคาบสมุทรไอบีเรีย , หกด้านบน
ภาษาที่พบในทวีต Basque CATA -
LAN , สเปน , สเปน , โปรตุเกสและ en -
glish . ยกเว้นภาษาอังกฤษซึ่งเป็นภาษาสากล
, และสเปน ซึ่งเป็นภาษา
แยก ,ส่วนที่เหลือของไอบีเรียภาษาลงมา
จากภาษาลาตินพื้นบ้านพูดในคาบสมุทร .
สเปนมีภาษาราชการ , Castilian (
เรียกว่าสเปน ) แต่กลางปกครอง --
ment ได้โอนบางส่วนของอำนาจของรัฐบาลในระดับภูมิภาคที่เรียกว่า
,
ชุมชนตนเอง บางส่วนของพวกเขามี จำกัด อย่างเป็นทางการ
ภาษา ตารางที่ 5 ประกอบด้วยสองเมทริกซ์
กับจำนวนของคู่ของภาษา cooc -
curring ในข้อความ ตารางที่ 5 . จะคำนวณโดยใช้ข้อความตัวอย่างด้วยตนเอง
การฝึกอบรมและข้อมูลทดสอบในขณะที่ตาราง 5 B
คำนวณจากการคาดการณ์ในชุดข้อมูลทดสอบ
. มี 4 บล็อกส่วนบุคคล
นั่นคืน ( 1 ) ภาษาอังกฤษ ( en ) ซึ่งเป็น
ภาษาทั่วโลก และ cooccurs ส่วนที่เหลือ
ภาษา ( 2 ) ภาษาอังกฤษ ( PT ) ซึ่งเป็นภาษาแห่งชาติ ติดต่อ
ตัวเล็กสเปน ; ( 3 ) สเปน ( es ) แห่งชาติลาน -
, cooccurring กับสเปน Co อย่างเป็นทางการ
ภาษา : คาตาลัน ( CA ) , สเปน ( GL ) และ
Basque ( EU ) ; และ ( 4 ) บล็อกของ Co -
เจ้าหน้าที่ ซึ่งไม่ได้เจอกันในทวิตเตอร์
เพราะพวกเขา ไม่ใช่ภาษาในการติดต่อ
การแปล กรุณารอสักครู่..
