4.5.3 How to do it with R
The factorial n! is computed with the command factorial(n) and the binomial coefficient (■(n@k)) with the command choose(n,k)
The sample spaces we have computed so far have been relatively small ,and we can visually study them without much trouble. However, it is very easy to generate sample spaces that are prohibitively large. And while R is wonderful and powerful and does almost everything except wash windows, even R has limits of which we should be mindful.
But we often do not need to actually generate the sample space; it suffices to count the number of outcomes. The nsamp function will calculate the number of rows in a sample space made by urnsamples without actually devoting the memory resources necessary to generate the sample space. The arguments are n, the number of (distinguishable) objects in the urn , k , the sample size , and replace , ordered , as above.
Example 4.25. We will compute the number of outcomes for each of the four urnsamples examples that we sew in Example4.2. Recall that we took a sample of size two from an urn with three distinguishable elements.
*******************************โปรแกรม*************************************
Compare these answers with the length of the data frames generated above.
The Multiplication Principle
A benefit of nsamp is that it is vectorized so that entering vectors instead of numbers for n , k , replace ,and ordered results in a vector of corresponding answers. This becomes particularly convenient for combinatorics problems.
Example 4.26. There are 11 artists who each submit a portfolio containing 7 paintings for competition in an art exhibition. Unfortunately, the gallery director only has space in the winners’ section to accommodate 12 paintings in a row equally spread over three consecutive walls. The director decides to give the first , second , and third place winners each a wall to display the work of their choice. The walls boast 31 separate lighting options apiece. How many displays are possible?
Answer: The judges will pick 3 (ranked) winner out of 11 (with rep = FALSSE , ord = TRUE).Each artist will select 4 of his/her paintings from 7 for display in a row(rep = FALSSE , ord = TRUE), and lastly, each of the 3 walls has 31 lighting possibilities(rep = TRUE , ord = FALSSE).These three numbers can be calculated quickly with
*******************************โปรแกรม*************************************
(Notice that ordered is always TRUE;nsamp will recycle ordered and replace to the appropriate length.) By the Multiplication Principle , the number of ways to complete the experiment is the product of the entries of x:
*******************************โปรแกรม*************************************
Compare this with the some other ways to compute the same thing:
*******************************โปรแกรม*************************************
As one can guess, in many of the standard counting problems there aren’t substantial savings in the amount of typing ;it is about the same using nsamp versus factorial and choose. But the virtue of nsamp lies in its collecting the relevant counting formulas in a one-stop shop. Ultimately, it is up to the user to choose the method that works best for him/herself.
Example 4.27. The Birthday Problem. Suppose that there are n people together in a room. Each person announces the date of his/her birthday in turn. The question is: what is the probability of at least one match? If we let the event A represent {there is at least one match},then would like to know P(A), but as we will see ,it is more convenient to calculate P(A^C ).
For starters we will ignore leap years and assume that there are only 365 days in a year. Second, we will assume that births are equally distributed over the course of a year (which is not true due to all sorts of complications such as hospital delivery schedules). See http://en.wikipedia.org/wiki/Birthday_problem for more.
Let us next think about the sample space. There are 365 possibilities for the first person’s birthday.365 possibilities for the second .and so forth. The total number of possible birthday sequences is therefore#(S)=365n.
Now we will use the complementation trick we saw in Example 4.11.We realize that the only situation in which A does not occur is if there are no matches among all people in the room. That is , only when everybody’s birthday is different.so
P(A)=1-P(Ac)=1-(〖#(A〗^c))/(#(S))
Since the outcomes are equally likely. Let us then suppose that there are no matches. The first person has one of 365 possible birthdays. The second person must not match the first , thus , the second person has only 364 available birthdays from which to choose. Similarly , the third person has only 363 possible birthdays, and so forth , until we reach the nth person. Who has only 365-n+1 remaining possible days for a birthday. By the Multiplication Principle, we have # (Ac)=365 ∙364∙∙∙(365-n+1), and
P(A)= 1-(365 ∙364∙∙∙(365-n+1))/〖365〗^n =1-364/365∙363/365∙∙∙((365-n+1))/365
As a surprising consequence ,consider this : how many people does it take to be in the room so that the probability of at least one match is at least 0.50? Clearly , if there is only n=1 person in the room then the probability of a match is zero, and when there are n=366 people in the room
*******************************กราฟ*************************************
There is a 100% chance of a match (recall that we are ignoring leap yeas). So how many people does it take so that there is an equal chance of a match and no match?
When I have asked this question to students, the usual response is “somewhere around n=180 people” in the room. The reasoning seems to be that in order to get a 50% chance of a match, there should be 50% of the available days to be occupied. The number of students in a typical classroom is 25, so as a companion question I ask students to estimate the probability of a match when there are n=25 students in the room. Common estimates are a 1%, or 0.5%, or even 0.1% chance of a match. After they have given their estimates, we go around the room and each student announces their birthday. More often than not, we observe a match in the class ,to the students’ disbelief.
Student are usually surprised to hear that, using the formula above, one needs only n=23 student to have a greater than 50% chance of at least one match. Figure 4.5.1 shows a graph of the birthday probabilities:
4.5.3 ทำยังไงกับ R
แฟกทอเรียล n ! จะคำนวณด้วยคำสั่งแฟกทอเรียล ( N ) และสัมประสิทธิ์ทวินาม ( ■ ( @ k ) ด้วยคำสั่งเลือก ( n , k )
ตัวอย่างเป็นเราได้คำนวณจนมีขนาดค่อนข้างเล็ก และเราสามารถมองเห็นการศึกษาพวกเขาได้โดยไม่มีปัญหามาก อย่างไรก็ตาม , มันเป็นเรื่องง่ายที่จะสร้างช่องว่างที่ถูก prohibitively ตัวอย่างขนาดใหญ่และในขณะที่ R เป็นที่ยอดเยี่ยมและมีประสิทธิภาพและทำเกือบทุกอย่างยกเว้น Windows ล้างแม้ R มีข้อจำกัด ซึ่งเราควรจะใจจดใจจ่อ .
แต่เรามักจะไม่ต้องจริงสร้างพื้นที่ตัวอย่าง มันก็ให้นับจํานวนผลลัพธ์ฟังก์ชัน nsamp จะคำนวณจำนวนแถวในพื้นที่ตัวอย่างที่ทำโดย urnsamples โดยไม่ต้องทุ่มเททรัพยากรที่จำเป็นเพื่อสร้างหน่วยความจำตัวอย่างพื้นที่ อาร์กิวเมนต์ n เป็นจำนวน ( แยกแยะ ) วัตถุในโกศ , K , ขนาดตัวอย่างและแทนที่คำสั่งข้างต้น
ตัวอย่าง 4.25 .เราจะคำนวณตัวเลขของผลสำหรับแต่ละสี่ urnsamples ตัวอย่างที่เราเย็บ example4.2 . จำได้ว่า เราเอาตัวอย่างของขนาดสองจากผอบที่มีสามองค์ประกอบที่แตกต่าง .
******************************* โปรแกรม *************************************
เปรียบเทียบคำตอบเหล่านี้กับความยาวของเฟรมข้อมูลที่สร้างขึ้นข้างบน
กฎการคูณประโยชน์ของ nsamp ก็คือว่ามัน vectorized เพื่อป้อนเวกเตอร์แทนเลข n , K , แทน และสั่งให้ผลในเวกเตอร์ของคำตอบที่สอดคล้องกัน นี้จะสะดวกโดยเฉพาะอย่างยิ่งสำหรับคณิตศาสตร์เชิงการจัดปัญหา .
ตัวอย่าง 4.26 . มี 11 ศิลปินที่ส่งแต่ละผลงานที่มี 7 ภาพวาดเพื่อการแข่งขันในนิทรรศการศิลปะ ขออภัยผู้อำนวยการหอศิลป์ มีเพียงพื้นที่ในส่วนของผู้ชนะเพื่อรองรับ 12 ภาพในแถวอย่างเท่าเทียมกันกระจายไปสามผนังติดกัน ผู้กำกับตัดสินใจให้แรกที่สองและที่สามผู้ชนะแต่ละผนังเพื่อแสดงการทำงานของทางเลือกของพวกเขา ผนังโม้ 31 แยกแสงตัวเลือกแต่ละ วิธีการหลายแสดงที่เป็นไปได้ ?
ตอบคณะกรรมการจะเลือก 3 ( อันดับ ) ผู้ชนะจาก 11 ( กับตัวแทน = falsse อ๊อด , จริง = ) ศิลปินแต่ละคน จะเลือก 4 ภาพวาดของเขา / เธอจาก 7 เพื่อแสดงในแถว ( ตัวแทน = falsse อ๊อด , จริง = ) , และสุดท้าย แต่ละที่ 3 ผนังมี 31 โอกาสแสงสว่าง ( ตัวแทน = = จริง เพื่อ falsse ) ตัวเลขทั้ง 3 สามารถคำนวณได้อย่างรวดเร็วด้วย
******************************* โปรแกรม *************************************
( สังเกตได้ว่าสั่งเป็นจริงเสมอ ; nsamp จะรีไซเคิลสั่งและแทนที่เพื่อความยาวที่เหมาะสม ) โดยกฎการคูณ จำนวนวิธีที่จะเสร็จสมบูรณ์การทดสอบผลิตภัณฑ์ของรายการของ X :
******************************* โปรแกรม *************************************เปรียบเทียบกับบางวิธีอื่น ๆเพื่อหาสิ่งที่เหมือนกัน
******************************* โปรแกรม ************************************* เป็นหนึ่งสามารถคาดเดาในหลายมาตรฐานนับปัญหาไม่มีความประหยัดในปริมาณการพิมพ์ มันเป็นเรื่องเดียวกันกับที่ใช้ nsamp เมื่อเทียบกับการทดลองและเลือกแต่ธรรมของ nsamp ตั้งอยู่ในการเก็บรวบรวมที่เกี่ยวข้องนับสูตรได้ในร้านเดียว ในที่สุดก็ขึ้นอยู่กับผู้ใช้ เพื่อเลือกวิธีที่เหมาะสมที่สุดสำหรับเขา / เธอ .
ตัวอย่าง 4.27 . เกิดปัญหา สมมติว่ามี N คนห้องเดียวกัน แต่ละคนประกาศวันที่ของเขา / เธอในวันเกิด ในการเปิด คำถาม : อะไรคือความเป็นไปได้อย่างน้อยหนึ่งตรงถ้าเราปล่อยให้เหตุการณ์แทน { } มีอย่างน้อยหนึ่งคู่ แล้วอยากทราบว่า P ( A ) แต่ที่เราเห็น มันสะดวกกว่าที่จะคำนวณ P (
c )
ก่อนอื่นเราจะไม่สนใจกระโดดปีและสมมติว่ามีเพียง 365 วันใน 1 ปี . ประการที่สองเราจะสมมติว่าเกิดมีการกระจายอย่างเท่าเทียมกันผ่านหลักสูตรของปี ( ซึ่งไม่เป็นความจริง เนื่องจากทุกประเภทของภาวะแทรกซ้อน เช่น กำหนดการส่งโรงพยาบาล ) ดู http://en.wikipedia.org/wiki/birthday_problem เพิ่มเติม .
เราถัดไปคิดเกี่ยวกับตัวอย่างพื้นที่ มี 365 ความเป็นไปได้สำหรับคนแรกของ birthday.365 โอกาสที่สอง และอื่น ๆจำนวนของลำดับวันเกิดที่สุดจึง# ( s ) = 365n .
ตอนนี้เราจะใช้เอนไซม์กลที่เราเห็นในตัวอย่าง 4.11.we ตระหนักว่าสถานการณ์เท่านั้น ซึ่งจะไม่เกิดขึ้นถ้าไม่มีการแข่งขันในหมู่คนทั้งหมดในห้อง นั่นคือ เมื่อวันเกิดของทุกคนจะแตกต่างกัน ดังนั้น
P ( A ) = 1-p ( AC ) = 1 - ( 〖# ( 〗
c ) / ( # ( s )
ตั้งแต่ผลมีแนวโน้มที่เท่าเทียมกันให้เราสมมติว่ามีไม่ตรงกัน คนแรกมี 365 วันเป็นไปได้ คนที่สอง จะต้องไม่ตรงกับครั้งแรก ดังนั้น คนที่ 2 ได้แค่ 364 ของวันเกิดที่ต้องเลือก ส่วนคนที่สามได้เพียง 363 เป็นไปได้วันเกิดและอื่น ๆจนกว่าเราจะไปถึงครั้งที่ร้อยคน ใครมีเหลือเพียง 1 วัน 365-n เป็นไปได้สำหรับวันเกิดโดยกฎการคูณ เรามี# ( AC ) = 365 ∙ 364 ∙∙∙ ( 365-n 1 ) ,
p ( A ) = 1 - ( 365 ∙ 364 ∙∙∙ ( 365-n 1 ) ) / 〖 365 〗
n = 1-364 / 365 ∙ 363 / 365 ∙∙∙ ( ( 365-n 1 ) / 365
ผลที่ตามมา , น่าแปลกใจพิจารณานี้ต้องใช้คนกี่คนอยู่ในห้องแล้วว่าน่าจะเป็นอย่างน้อยหนึ่งนัดเป็นอย่างน้อย 0.50 ? อย่างชัดเจนหากมีเพียง n = 1 คนในห้อง น่าจะตรงกันคือศูนย์ และเมื่อมี N = 366 คนในห้อง
******************************* กราฟ ************************************* มีโอกาส 100% ของราคา ( จำได้ว่า เราจะไม่สนใจกระโดด yeas ) ดังนั้น ต้องใช้คนกี่คน ให้มี โอกาสที่เท่าเทียมกันของการแข่งขันและการแข่งขัน
เมื่อผมถามคำถามนี้กับนักเรียน การตอบสนองที่ปกติคือ " แถว N = 180 คน " ในห้อง ดูเหมือนว่าเหตุผลที่เป็นเพื่อที่จะได้มีโอกาส 50% ของราคาควรมี 50% ของวันพร้อมที่จะครอบครอง จำนวนนักเรียนในชั้นเรียนปกติคือ 25ดังนั้นเป็นคำถามเพื่อนฉันถามนักเรียนเพื่อประเมินความน่าจะเป็นของการแข่งขัน เมื่อมี N = 25 นักเรียนในห้อง ประมาณการทั่วไปคือ 1% , หรือ 0.5 เปอร์เซ็นต์ , หรือแม้กระทั่ง 0.1% โอกาสของการแข่งขัน หลังจากที่พวกเขาได้ให้ประมาณการของพวกเขา เราเดินไปรอบๆห้องและนักเรียนแต่ละประกาศวันเกิดของพวกเขา บ่อยกว่าไม่ , เราสังเกตตรงในชั้นเรียน การไม่ยอมรับของนักเรียน
นักเรียนมักจะประหลาดใจที่ได้ยินว่า ใช้สูตรข้างต้น หนึ่งต้องการเพียง n = นักเรียน 23 มีมากกว่า 50% โอกาสอย่างน้อยหนึ่งตรงกัน รูป 4.5.1 แสดงกราฟของวันเกิด :
ความน่าจะเป็น
การแปล กรุณารอสักครู่..