Suppose that Y is the number of treatment episodes in a case; obviously, Y has the values ranged from 1 to m (without zero value) where m is the largest number of treatment episodes in a case. Now data Y are tallied into a frequency table like Table 1. We let i be the number of treatment episodes in a case, ni be the number (frequency) of cases identified with i episodes where i 1,2,,m and a sample size n n1 n2 nm is the total num- ber of observed cases. In Table 1, the observed frequen- cies of treatment episodes for heroin users in Thailand 2005 are n1 = 3057, n2 = 791, n3 = 351, n4 = 107, n5 = 80, n6 = 59, n7+ = 22.
To estimate the population size N and the size of zero treatment episode n0, we let p1,, pm be probabilities of cases identified 1,,m times. Under homogeneity, the density function pi is assumed to be a zero-truncated Poisson since zero identification does not occur in the sample; that is,
f i, expi i! pi f i,
1 f 0, 1exp
where i 1,2,. However, frequently the homogeneous model is not appropriate in real situations to fit an adequate model. Mixture models allowing for heterogeneity are more flexible and we consider a discrete mixture of truncated Poisson densities of the form
k
pi f i Q, q fj i,j (3)
j1
where the mixing distribution Qq q11 22 qkk
gives weights qj 0 to parameters j for j 1,2,,k, k is the number of components in the mixture and
k
qj 1. Then, the log-likelihood for the mixture of
j1
zero-truncated count densities is
m
log L Q ni logf i Q,
i1
(4)
m k
ni log q fj i,j
i1 j1
In this situation, with the help of gradient functions and the consideration at the boundaries of parameter space, the log-likelihood is concave on the parameter space of all discrete probability densities on which it can be maximized, leading to the nonparametric maximum likelihood estimator (NPMLE) of Q. To proceed in the EM context, we need the complete data log likelihood, which is given in this case as
m k
log LCD Q ni zij log fi,j
i1 j1
(5) m k
ni zij logqj
i1 j1
where the unobserved covariate zij is 1 if i belongs to component j and 0 otherwise. In the E-step, the unobserved indicator variates, zij , are replaced by their expected posterior probabilities, eij , leading to eij E z ij n qi; j ,j
P z ij 1 n qi; j ,j (6) f i,j qj
k
f i,j qj
j1
In the M-step, the new values ˆ1,,ˆk , qˆ1,,qˆk are found, which maximize the expected version of complete log likelihood (5). The results of the weighting estimates qˆ1,,qˆk are obtained by
1 m
qˆ j n i1 nei ij , for j 1,,k (7)
Similarly, the solution after solving the equations of derivatives with respect to ˆj is obtained by
m
i1in ei ij ˆ , for j 1,,k (8)
ˆj m 1exp j
i1n ei ij
Note that (8) does not provide a close form solution; the iterative procedure is needed until the desired accuracy is achieved. Having identified the model and the associated parameter estimates, we can estimate the probability of zero treatment episodes p0 as
pˆ0 kj1expˆj qˆ j (9)
so that the Horvitz-Thompson approach leads to a population size estimate
สมมติว่า Y จำนวนตอนรักษาในกรณี อย่างชัดเจน Y มีค่าอยู่ในช่วง 1 เมตร (ไม่มีค่าศูนย์) โดยที่ m คือ จำนวนตอนรักษาในกรณีที่ใหญ่ที่สุด ตอนนี้ ข้อมูล Y มีแน่เป็นตารางความถี่เช่นตารางที่ 1 เราให้ฉันได้จำนวนตอนรักษาในกรณี ni เป็นจำนวน (ความถี่) กรณีที่ระบุกับฉันตอนที่ฉัน 1, 2 m และเป็นตัวอย่างขนาด n n1 n2 nm เป็น num-ber รวมของกรณีและปัญหาที่พบ ในตารางที่ 1, frequen-cies สังเกตของตอนรักษาผู้ใช้เฮโรอีนในปี 2548 ประเทศไทยมี n1 = 3057, n2 = 791, n3 = 351, n4 = 107, n5 = 80, n6 = 59, n7 + = 22 การประมาณขนาดของประชากร N และขนาดของศูนย์บำบัดตอน n0 เราให้ p1 น.เป็นกิจกรรมของกรณีระบุ 1 m ครั้ง ภายใต้ homogeneity ปี่ฟังก์ชันความหนาแน่นจะถือ ปลาตัดศูนย์ตั้งแต่รหัสศูนย์เกิดขึ้นในตัวอย่าง นั่นก็คือ f i expi ฉัน พี่ f i 1 f 0 1exp ที่ฉัน 1, 2 อย่างไรก็ตาม บ่อยแบบเหมือนไม่ได้ในสถานการณ์จริงให้พอดีกับแบบจำลองเพียงพอ รุ่นผสมสามารถ heterogeneity จะมีความยืดหยุ่นมากขึ้น และเราพิจารณาผสมผสานระหว่างความหนาแน่นปัวตัดของแบบแยกกัน k พี่ f i Q, q fj i, j (3) j1 ซึ่งการผสมกระจาย Qq q11 22 qkk ให้น้ำหนัก qj 0 j พารามิเตอร์สำหรับเจ 1, 2 k, k เป็นจำนวนส่วนประกอบในส่วนผสม และ k qj 1 แล้ว ล็อกโอกาสสำหรับส่วนผสมของ j1 มีความหนาแน่นของจำนวนที่ถูกปัดเศษเป็นศูนย์ m เข้าสู่ระบบ L Q ni logf i Q i1 (4) m k ni log q fj i, j i1 j1 ในสถานการณ์นี้ ด้วยความช่วยเหลือของฟังก์ชันไล่โทนสีและการพิจารณาในขอบเขตของพารามิเตอร์ โอกาสล็อกได้เว้าบนพื้นที่พารามิเตอร์ของความหนาแน่นความน่าเป็นแยกกันทั้งหมดที่ มันสามารถขยายใหญ่สุด นำไปสู่โอกาส nonparametric สูงสุดประมาณ (NPMLE) ของ Q ดำเนินการในบริบท EM เราต้องสมบูรณ์ข้อมูลล็อกโอกาส ในกรณีนี้เป็น m k ระบบ LCD Q ni zij ล็อก fi, j i1 j1 (5) m k ni zij logqj i1 j1 ที่ zij unobserved covariate คือ 1 ถ้าฉันเป็นของเจคอมโพเนนต์และ 0 เป็นอย่างอื่น ใน E-ขั้นตอน ตัวบ่งชี้ unobserved variates, zij จะถูกแทนที่ โดยกิจกรรมหลังการคาด eij นำ eij E z ij แค n ฉี j, j P z ij แค 1 n ฉี เจ j qj, j (6) f i k f i, j qj j1 ใน M-ขั้นตอน ใหม่ค่า ˆ1 ˆk, qˆ1 qˆk จะพบ ที่เพิ่มรุ่นคาดโอกาสบันทึกสมบูรณ์ (5) ผลของน้ำหนักประมาณ qˆ1 qˆk จะได้รับโดย 1 เมตร qˆ เจ n i1 nei ij แค สำหรับเจ 1 k (7) ในทำนองเดียวกัน การแก้ปัญหาหลังจากการแก้สมการอนุพันธ์กับ ˆj จะได้รับโดย m i1in ei ij แคˆ สำหรับเจ 1 k (8) ˆj m 1exp j Ij แค ei i1n หมายเหตุที่ (8) ให้ปิดแบบฟอร์มโซลูชัน ขั้นตอนซ้ำเป็นสิ่งจำเป็นจนกว่าจะบรรลุความต้องการ มีระบุรูปแบบและพารามิเตอร์ที่เกี่ยวข้องประเมิน เราสามารถประเมินความน่าเป็นของศูนย์ p0 ตอนรักษาเป็น pˆ0 kj1expˆj qˆ j (9) เพื่อให้วิธีทอมป์สัน Horvitz นำไปสู่การประเมินขนาดของประชากร
การแปล กรุณารอสักครู่..
สมมติว่า Y คือจำนวนตอนการรักษาในกรณีนั้น เห็นได้ชัดว่า Y มีค่าตั้งแต่ 1 ถึงม. (ไม่รวมค่าศูนย์) ที่ m เป็นจำนวนมากที่สุดของตอนการรักษาในกรณีที่ ตอนนี้ข้อมูล Y จะชวนลงในตารางความถี่เช่นตารางที่ 1 เราปล่อยให้ฉันเป็นจำนวนตอนการรักษาในกรณีที่พรรณีเป็นจำนวน (ความถี่) ของกรณียึดติดกับฉันตอนที่ฉัน1,2, , ม. และ A N ขนาดของกลุ่มตัวอย่างn1 n2 nmเป็นจำานวนรวมของกรณีที่สังเกต ในตารางที่ 1 สังเกตความถี่ของโรคการรักษาสำหรับผู้ใช้ยาเสพติดในประเทศไทยปี 2005 มี 1 n = 3057, n 2 = 791, 3 = 351 4 = 107, N5 = 80, N6 = 59, N7 + 22 =
เพื่อประเมิน ขนาดของประชากร n และขนาดของ n0 ตอนการรักษาที่ศูนย์ที่เราปล่อยให้ p1, เที่ยงจะมีความน่าจะเป็นในกรณีที่ระบุ 1, ครั้งเมตร ภายใต้ความเป็นเนื้อเดียวกันฟังก์ชั่นความหนาแน่นปี่จะถือว่าเป็น Poisson ศูนย์ตัดตั้งแต่ศูนย์ประจำตัวประชาชนไม่ได้เกิดขึ้นในตัวอย่าง; ว่ามีที่ฉi, expii!
ปี่fi,
1ฉ0, 1expที่ฉัน1,2,
แต่บ่อยครั้งที่รูปแบบเป็นเนื้อเดียวกันไม่เหมาะสมในสถานการณ์จริงเพื่อให้พอดีกับรูปแบบที่เพียงพอ รูปแบบผสมเพื่อให้แตกต่างมีความยืดหยุ่นมากขึ้นและเราจะพิจารณาเป็นส่วนผสมที่ไม่ต่อเนื่องของความหนาแน่น Poisson ตัดทอนรูปแบบ
k
ปี่fiคิวq FJ i, j (3)
j1ที่
ผสมกระจายQq Q11
22qkkให้น้ำหนัก QJ 0 ถึงพารามิเตอร์jสำหรับเจ1,2, , k, k คือจำนวนขององค์ประกอบในการผสมและ k qj1 จากนั้นเข้าสู่ระบบความน่าจะเป็นส่วนผสมของj1ศูนย์ตัดทอนความหนาแน่นนับเป็นม. ล็อกLQnilogfiคิวi1 (4) ม. k nilog คิว FJ i, ji1j1ในสถานการณ์เช่นนี้ด้วยความช่วยเหลือของฟังก์ชั่นการไล่ระดับสีและการพิจารณาในขอบเขตของพื้นที่พารามิเตอร์ที่เข้าสู่ระบบความน่าจะเป็นในพื้นที่เว้าพารามิเตอร์ของทุกความหนาแน่นของความน่าจะเป็นที่ไม่ต่อเนื่องในการที่จะสามารถขยายนำไปสู่การประมาณค่าความน่าจะเป็นสูงสุดไม่อิงพารามิเตอร์ (NPMLE) ของ Q. หากต้องการสำรองในบริบท EM เราต้องโอกาสเข้าสู่ระบบข้อมูลที่สมบูรณ์ที่จะได้รับในกรณีนี้เป็นmk ล็อกจอแอลซีดี Q ni Zij ล็อกfi, ji1j1 (5) mk ni Zij logqj i1j1ที่ Zij ตัวแปรร่วมสังเกตคือ 1 ถ้าฉันเป็นส่วนประกอบญ และ 0 ผู้อื่น ใน E-ขั้นตอนตัวบ่งชี้ที่ไม่มีใครสังเกต variates, Zij, จะถูกแทนที่ด้วยความน่าจะเป็นหลังคาดว่าพวกเขา EIJ นำไปสู่การ EIJ E zเจฉี n; เจj P zเจ1ฉี n; เจj (6) fi, jqj k fi, jqjj1ในM-ขั้นตอนค่าใหม่1, , k, q1, , QK จะพบซึ่งเพิ่มรุ่นที่คาดว่าน่าจะเป็นล็อกฉบับสมบูรณ์ (5) ผลของการประมาณการน้ำหนัก q1, , QK จะได้รับโดย1 เมตรคิวเจ n i1เน่ยเจสำหรับเจ1, , k (7) ในทำนองเดียวกันการแก้ปัญหาหลังจากการแก้สมการอนุพันธ์ที่มีความเคารพ เพื่อjจะได้รับโดยม. i1inเจเนสำหรับเจ1, , k (8) jม1expji1nเจเนทราบว่า(8 ) ไม่ได้ให้แก้ปัญหารูปแบบใกล้ชิด; ขั้นตอนซ้ำเป็นสิ่งจำเป็นจนกว่าความถูกต้องที่ต้องการจะประสบความสำเร็จ มีการระบุรูปแบบและประมาณการที่เกี่ยวข้องพารามิเตอร์ที่เราสามารถประเมินความน่าจะเป็นอาการของโรคการรักษาศูนย์ P0 เป็นp0 kj1expjqญ (9) เพื่อให้วิธีการ Horvitz ธ อมป์สันนำไปสู่การประมาณการขนาดของประชากร
การแปล กรุณารอสักครู่..
สมมติว่า Y เป็นจำนวนครั้งในการรักษากรณี ; เห็นได้ชัดว่า Y ได้ค่าอยู่ระหว่าง 1 ถึง m ( ไม่มีค่าศูนย์ ) ซึ่งเป็นหมายเลขที่ใหญ่ที่สุดของการรักษาในเอพคดี ตอนนี้ข้อมูล y จะนับในความถี่ตารางเช่นโต๊ะ 1 เราให้ฉันเป็นจำนวนครั้งการรักษาในกรณีที่ผมเป็นหมายเลข ( ความถี่ ) กรณีระบุกับผมตอนที่ผม 1 , 2 ,เมตรและขนาดตัวอย่าง n N1 N2 nm เป็นรวมน้ำ - เบอร์สังเกตกรณี ตารางที่ 1 และ frequen - cies รักษาเอพสำหรับผู้ใช้เฮโรอีนในประเทศไทยปี 2548 N1 = 2987 , n2 = 3 = 40 , 351 , N4 = 107 , 5 = 80 , n6 = 59 , N7 = 22
ประมาณขนาดประชากรและขนาดของศูนย์การรักษาตอนที่ 30 , เราให้ P1 PM เป็นน่าจะเป็นกรณีระบุ 1 , M ครั้งภายใต้ค่า ฟังก์ชันความหนาแน่น พี ถือว่าเป็นศูนย์ตัดทอนปัวซอตั้งแต่ศูนย์ตัวไม่ได้เกิดขึ้นในตัวอย่าง คือ
F ผม EXP ฉัน ! ปี่ F ผม
1 F 0 1 EXP
ที่ผม 1 2 . อย่างไรก็ตาม บ่อย แบบเป็นเนื้อเดียวกันไม่เหมาะสมในสถานการณ์จริงเพื่อให้พอดีกับรูปแบบอย่างเพียงพอรุ่นที่สามารถผสมให้มีความยืดหยุ่นมากขึ้น และเราพิจารณาส่วนผสมที่ไม่ต่อเนื่องของปัวซงตัดความหนาแน่นของแบบฟอร์ม
k
pi F ผม Q , Q FJ ผม J ( 3 ) 1
J ที่ผสม Q Q กระจายอาชีพ 22 qkk
ให้น้ำหนัก QJ 0 พารามิเตอร์ เจเจ 1 2 , k , k คือจำนวนขององค์ประกอบในส่วนผสมและ
k
QJ 1 จากนั้นโอกาสเข้าสู่ระบบสำหรับส่วนผสมของ
J 1
ศูนย์ตัดนับความหนาแน่นคือ
L
Q ) M ผม logf ผม Q ,
ฉัน 1
( 4 )
M K
ฉันเข้าสู่ระบบ Q FJ ผม J
ผม 1 J 1
ในสถานการณ์นี้ ด้วยความช่วยเหลือของฟังก์ชันและการพิจารณาในขอบเขตของพื้นที่พารามิเตอร์บันทึกความน่าจะเป็นคือเว้าบนพารามิเตอร์พื้นที่ทั้งหมดต่อเนื่องความน่าจะเป็น ) ซึ่งสามารถขยายสู่วิธี Maximum Likelihood ประมาณการ ( npmle ) Q เพื่อดำเนินการต่อในเอ็มบริบท เราต้องการข้อมูลที่สมบูรณ์บันทึกโอกาส ซึ่งจะได้รับในกรณีนี้
M K
เข้าสู่ระบบ LCD คิว นิ ซิจ Log F ผม J
ฉัน 1 J 1
( 5 ) M K
ซิจ logqj
นิผม 1
1 J ที่ชุด unobserved ซิจเป็น 1 ถ้าเป็นของส่วนประกอบ J และ 0 เป็นอย่างอื่น ใน e-step , ตัวบ่งชี้ variates unobserved ซิจ , จะถูกแทนที่ด้วยของพวกเขาคาดด้านหลัง , ความน่าจะเป็น eij ไปสู่ eij E Z IJ N Qi ; J , J
P Z ij 1 N Qi ; J , J ( 6 ) F ผม J
QJ K F ผม J Q J
J
1 ใน m-step , ใหม่ค่าˆ 1 , ˆ , เคQ ˆ 1 , Q ˆ K จะพบ ซึ่งคาดว่าจะเพิ่มรุ่นของความน่าจะเป็นเข้าสู่ระบบที่สมบูรณ์ ( 5 ) ผลของน้ำหนักประมาณการ Q ˆ 1 , Q ˆ K จะได้รับโดย
1 M
Q ˆ J N ผม 1 เนย ij , J 1 , , K ( 7 )
ในการแก้ปัญหาหลังการแก้สมการอนุพันธ์ของเกี่ยวกับˆ J ได้รับโดย
m
ผม 1in EI ij ˆ , J 1 , , K ( 8 )
ˆ J M 1 EXP J
ผมกับ EI ij
หมายเหตุ ( 8 ) ไม่ได้ให้โซลูชั่นแบบใกล้ชิด ขั้นตอนซ้ำเป็นสิ่งจำเป็นจนกว่าที่ต้องการความถูกต้องได้ มีการระบุรูปแบบและพารามิเตอร์ที่เกี่ยวข้องประมาณการ เราสามารถประมาณค่าความน่าจะเป็นของศูนย์การรักษาด้วย
p ตอนเป็นˆ 0 KJ 1exp ˆ J Q ˆ J ( 9 )
ดังนั้นวิธีการ Horvitz ทอมป์สันไปสู่ประชากรขนาดประมาณ
การแปล กรุณารอสักครู่..