To formalize our ideas, we need to decide on a description method, that is, a formal
language in which to express properties of the data. The most general choice is
a general-purpose2 computer language such as C or Pascal. This choice leads to
the definition of the Kolmogorov complexity [Li and Vit´anyi 1997] of a sequence as
the length of the shortest program that prints the sequence and then halts. The
lower the Kolmogorovcomplexity of a sequence, the more regular it is. This notion
seems to be highly dependent on the particular computer language used. However,
it turns out that for every two general-purpose programming languages A and B
and every data sequence D, the length of the shortest program for D written in
language A and the length of the shortest program for D written in language B
differ by no more than a constant c, which does not depend on the length of D. This
so-called invariance theorem says that, as long as the sequence D is long enough,
it is not essential which computer language one chooses, as long as it is generalpurpose.
Kolmogorovcomplexity was introduced, and the invariance theorem was
proved, independently by Kolmogorov [1965], Chaitin [1969] and Solomonoff [1964].
Solomonoff’s paper, called “A Formal Theory of Inductive Inference,” contained the idea that the ultimate model for a sequence of data may be identified with the
shortest program that prints the data. Solomonoff’s ideas were later extended by
several authors, leading to an ‘idealized’ version of MDL [Solomonoff 1978; Li and
Vit´anyi 1997; G´acs, Tromp, and Vit´anyi 2001]. This idealized MDL is very general
in scope, but not practically applicable, for the following two reasons:
1. Uncomputability. It can be shown that there exists no computer program that,
for every set of data D, when giv en D as input, returns the shortest program that
prints D [Li and Vit´anyi 1997].
2. Arbitrariness/dependence on syntax. In practice we are confronted with small
data samples for which the invariance theorem does not say much. Then the
hypothesis chosen by idealized MDL may depend on arbitrary details of the syntax
of the programming language under consideration.
การทำให้เป็นรูปเป็นร่างความคิดของเรา เราต้องตัดสินใจเกี่ยวกับรายละเอียดของวิธีการที่เป็นอย่างเป็นทางการภาษาซึ่งแสดงคุณสมบัติของข้อมูล ตัวเลือกทั่วไปมากที่สุดคือเป็น general-purpose2 ภาษาคอมพิวเตอร์ เช่น C หรือปาสคาล เลือกตัวเลือกนี้ ไปสู่คำนิยามของการเปลี่ยนแปลงที่ซับซ้อน และ วิตใหม่ [ Anyi 1997 ] ของลำดับเป็นความยาวที่สั้นที่สุดโปรแกรมที่พิมพ์ลำดับแล้วหยุด . ที่ลด kolmogorovcomplexity ของลำดับมากกว่าปกติค่ะ ความคิดนี้ดูเหมือนจะสูง ขึ้นอยู่กับโดยเฉพาะภาษาคอมพิวเตอร์ที่ใช้ อย่างไรก็ตามปรากฎว่าทุกสองภาษาโปรแกรม A และ B เอนกประสงค์และทุก ๆลำดับข้อมูล D , ความยาวของโปรแกรมที่ให้เขียนในภาษาและความยาวของโปรแกรมที่ให้เขียนในภาษาบีต่างกันไม่เกินค่าคงที่ C ซึ่งไม่ได้ขึ้นอยู่กับความยาวของวันนี้ทฤษฎีบทความไม่แปรผันที่เรียกว่ากล่าวว่าตราบใดที่ลำดับ D นานพอมันไม่ได้เป็นสิ่งจำเป็นที่คอมพิวเตอร์ภาษาหนึ่งเลือก , ตราบเท่าที่มันเป็น generalpurpose .kolmogorovcomplexity เป็นที่รู้จัก และแปรเปลี่ยนเป็นทฤษฎีบทพิสูจน์ได้โดยอิสระโดยเปลี่ยนแปลง [ 1965 ] , chaitin [ 1969 ] และ โซโลโมนอฟ [ พ.ศ. 2507 ]กระดาษ โซโลโมนอฟ , เรียกว่า " ทฤษฎีอย่างเป็นทางการของการอุปนัย , " มีความคิดว่าแบบจำลองที่ดีที่สุดสำหรับลำดับของข้อมูลที่อาจจะระบุด้วยที่สั้นที่สุดโปรแกรมที่พิมพ์ข้อมูล ความคิดของ โซโลโมนอฟ ต่อมาขยายโดยผู้เขียนหลาย ที่นำไปสู่การ " " รุ่น โซโลโมนอฟ นักวิทยาศาสตร์ในอุดมคติ [ 1978 ; ลี และวิตใหม่ Anyi 1997 ; G ใหม่ ACS , เดินช้าๆ และ วิตใหม่ Anyi 2544 ] MDL อุดมคตินี้ทั่วไปมากในขอบเขต แต่ไม่ได้จริงที่ใช้สำหรับสองเหตุผลดังต่อไปนี้ :1 . uncomputability . มันสามารถแสดงให้เห็นว่ามีอยู่คอมพิวเตอร์ไม่มีโปรแกรมนั้นทุกชุดข้อมูล D เมื่อ giv en d เป็น input โปรแกรมผลตอบแทนที่สั้นที่สุดพิมพ์ D [ ลี้ และ วิตใหม่ Anyi 1997 ]2 . ตามอำเภอใจ / พึ่งพาวากยสัมพันธ์ ในทางปฏิบัติเราจะเผชิญกับขนาดเล็กข้อมูลตัวอย่างที่ทฤษฎีบทความไม่แปรเปลี่ยน ไม่พูดมาก จากนั้นสมมติฐานเลือก โดยนักวิทยาศาสตร์ในอุดมคติอาจขึ้นอยู่กับรายละเอียดโดยพลการของไวยากรณ์ของภาษาการเขียนโปรแกรม ภายใต้การพิจารณา
การแปล กรุณารอสักครู่..
