I. INTRODUCTION
The credit risk is one of the major risks that a loans
institution has to manage. This risk arises when a borrower
doesn’t pay his debt in the fixed due. To face up this kind of
risk, banks’ managers have to look for efficient solutions to
well distinguish good from bad risk applicant.
Credit scoring is one of the most successful financial risk
management solutions developed for lending institutions, this
solution has been fundamental in consumer credit management
since Durand [1] works and stays competitive to our days.
Authors like Feldman [2], Thomas et al. [3] and Saporta [4]
defined the Credit scoring as the process of determining how
likely a particular applicant is default with repayment.
Credit scoring methods are applied in order to classify possible
creditors in two classes of risk: good and bad [5]. These
methods use explanatory variables obtained from applicant
information to estimate his Intended performance to pay back
loan. A large number of classification methods can be used
in the process of identifying borrowers’ behavior as decision
trees [6], neural networks [7], discriminant analysis [8], [9],
logistic regression [10], [11] . . .
Both these techniques can provide good discrimination but the
most common used methods for building scorecard (i.e. credit
models) are discriminant analysis and logistic regression.
Logistic regression is a more appropriate technique for Credit
scoring cases [12]. Fan and Wang [13] and Sautory et al.
[14] recommend the use of the binary logistic regression in
Credit scoring cases, when discriminant analysis application
conditions are not obtainable. This choice becomes imperative
if qualitative variables get involved in the model [15].
Available information about credit candidate supplies a fundamental
element in his credit request acceptation, information
lack in credit risk valorization is suspected to lead to wrong
decision making. In this paper, we will focus in Credit
scoring evaluation, using logistic regression technique when
the population of interest is characterized by a small size.
Borrower’s behavior is described by a binary target variable
denoted Y , value taken by this last one supplies a basic
element in credits’ granting decision, Y = 0 when the
borrower presents problem and Y = 1 otherwise. Beside
this variable, every borrower is also described by a set of
description variables (X1,X2, . . . , Xd) informing about the
borrower and about his accounts’ functioning.
The sample of loans’ applicants results from a heterogeneous
population formed by borrowers customers and others who
are not. Here we deal with the problem of discrimination
in the case of a subpopulations’ mixture, where the two
subpopulations are respectively: borrowers’ customers and
borrowers’ non customers. More precisely, we will focus
in non customers subpopulation credit worthiness evaluation,
assuming that sample size of this subpopulation is considered
weak.
Beginning with the hypothesis that population size is one of
the most important factors affecting the classification power of
the logistic regression technique, we evaluate future customers
(i.e non customer) behavior to pay back loan, by looking
for efficient solution to the problem of non customers small
sample size.
We proceed to investigate how using the information on hand
of borrowers customers and non customers can be efficient.
The first approach, which is generally used by banks, consists
in using the borrowers customers predictive model, to predict
borrowers non customers behavior. However, it does not
take into account, difference between the two subpopulations.
Another approach consists in using a learning sample resulting
I. บทนำความเสี่ยงด้านเครดิตเป็นหนึ่งวิชาเสี่ยงที่สินเชื่อสถาบันการจัดการได้ ความเสี่ยงนี้เกิดขึ้นเมื่อผู้กู้ยืมไม่ชำระหนี้ของเขาในคงครบกำหนด การเผชิญหน้านี้ชนิดของความเสี่ยง ผู้จัดการธนาคารได้หาวิธีแก้ไขปัญหาอย่างมีประสิทธิภาพดีแยกแยะดีจากผู้สมัครไม่เสี่ยงคะแนนเครดิตเป็นหนึ่งในความเสี่ยงทางการเงินที่ประสบความสำเร็จมากที่สุดการพัฒนาให้สินเชื่อสถาบัน นี้โซลูชั่นได้รับพื้นฐานในการจัดการสินเชื่อผู้บริโภคตั้งแต่งาน Durand [1] และต้องการลงแข่งขันเป็นวันของเราผู้เขียนชอบ Feldman [2], al. และ Thomas [3] และ Saporta [4]กำหนดเครดิตที่ให้คะแนนเป็นการกำหนดวิธีมีแนวโน้มผู้สมัครเฉพาะคือ เริ่มต้น ด้วยค่าวิธีการให้คะแนนสินเชื่อจะใช้เพื่อจัดประเภทได้ใน 2 ประเภทของความเสี่ยงที่เจ้าหนี้: ดีและไม่ดี [5] เหล่านี้วิธีใช้อธิบายตัวแปรที่ได้รับจากผู้สมัครข้อมูลการประเมินประสิทธิภาพของเขาไว้ไปคืนเงินกู้ยืม สามารถใช้วิธีการจัดประเภทเป็นจำนวนมากกำลังระบุพฤติกรรมของผู้กู้เป็นการตัดสินใจต้น [6], เครือข่ายประสาท [7] การวิเคราะห์ discriminant [8], [9],โลจิสติกถดถอย [10], [11] ...ทั้งสองเทคนิคเหล่านี้สามารถให้เลือกปฏิบัติดีแต่ทั่วไปส่วนใหญ่ใช้วิธีการสำหรับการสร้างดัชนีชี้วัด (เช่นเครดิตรุ่น) เป็นการวิเคราะห์ discriminant และถดถอยโลจิสติกถดถอยโลจิสติกเป็นเทคนิคที่เหมาะสมสำหรับเครดิตคะแนนกรณี [12] พัดลม และวัง [13] และ Sautory et al[14] แนะนำการใช้การถดถอยโลจิสติกไบนารีในคะแนนกรณี เครดิตเมื่อโปรแกรมประยุกต์การวิเคราะห์ discriminantเงื่อนไขไม่มีสิทธิได้รับ ตัวเลือกนี้กลายเป็นความจำเป็นถ้าตัวแปรเชิงคุณภาพได้รับเกี่ยวข้องในแบบจำลอง [15]มีข้อมูลเกี่ยวกับผู้สมัครสินเชื่อวัสดุพื้นฐานองค์ประกอบในการบอกกล่าวเขาขอเครดิต ข้อมูลขาดใน valorization ความเสี่ยงเครดิตถูกสงสัยว่าทำไม่ถูกต้องตัดสินใจ ในเอกสารนี้ เราจะมุ่งเน้นในสินเชื่อคะแนนประเมินผล การใช้เทคนิคการถดถอยโลจิสติกเมื่อประชากรที่น่าสนใจคือลักษณะ โดยมีขนาดเล็กมีอธิบายลักษณะการทำงานของผู้กู้ โดยตัวแปรฐานสองเป้าหมายสามารถบุ Y โดยอันนี้สุดท้ายค่าวัสดุพื้นฐานองค์ประกอบในของเครดิตการให้สิทธิการตัดสินใจ Y = 0 เมื่อการผู้กู้นำเสนอปัญหาและ Y = 1 หรือ ด้านข้างนี้ตัวแปร กู้ทุกยังได้อธิบายไว้ โดยชุดของคำอธิบายตัวแปร (X 1, X 2,..., Xd) แจ้งให้ทราบเกี่ยวกับการกู้ และการทำงานของบัญชีของเขาตัวอย่างของผู้สมัครสินเชื่อของผลจากความแตกต่างกันประชากรที่เกิดขึ้นจากลูกค้าผู้กู้และผู้อื่นที่ไม่ ที่นี่เราจัดการกับปัญหาเลือกปฏิบัติในกรณีที่ส่วนผสมของ subpopulations ที่สองมี subpopulations ตามลำดับ: ลูกค้าของผู้กู้ และลูกค้าไม่ใช่ของผู้กู้ ได้แม่นยำมาก เราจะมุ่งเน้นในลูกค้าไม่ subpopulation สินเชื่อประเมินความคุ้มค่าสมมติว่าที่ขนาดตัวอย่างของ subpopulation นี้ถือว่าเป็นอ่อนแอเริ่มต้น ด้วยสมมติฐานที่ขนาดประชากรเป็นหนึ่งปัจจัยสำคัญที่ส่งผลกระทบต่ออำนาจการจัดประเภทของเทคนิคการถดถอยโลจิสติก เราประเมินลูกค้าในอนาคตลักษณะการทำงาน (อาทิไม่ใช่ลูกค้า) เพื่อใช้คืนเงินกู้ยืม โดยมองการแก้ไขปัญหาของลูกค้าขนาดเล็กไม่มีประสิทธิภาพขนาดของตัวอย่างเราดำเนินการตรวจสอบการใช้ข้อมูลในของผู้กู้ ลูกค้าและลูกค้าไม่ได้มีประสิทธิภาพวิธีแรก ซึ่งโดยทั่วไปใช้ธนาคาร ประกอบด้วยในการใช้ผู้กู้ลูกค้าคาดการณ์รูปแบบ ทำนายการทำงานลูกค้าไม่ใช่ผู้กู้ อย่างไรก็ตาม มันไม่ได้ทำบัญชี ความแตกต่างระหว่าง subpopulations สองประกอบด้วยวิธีการอื่นในการเรียนรู้ที่เกิดขึ้นอย่าง
การแปล กรุณารอสักครู่..
I. บทนำความเสี่ยงด้านเครดิตเป็นหนึ่งในความเสี่ยงที่สำคัญที่เงินให้สินเชื่อสถาบันการศึกษาที่มีการจัดการ ความเสี่ยงนี้เกิดขึ้นเมื่อผู้กู้ไม่ชำระหนี้ของเขาในการแก้ไขเนื่องจาก ที่จะเผชิญหน้ากับชนิดของความเสี่ยงผู้จัดการธนาคารต้องมองหาโซลูชั่นที่มีประสิทธิภาพในการกันความแตกต่างที่ดีจากผู้สมัครที่มีความเสี่ยงที่ไม่ดี. คะแนนเครดิตเป็นหนึ่งในความเสี่ยงทางการเงินที่ประสบความสำเร็จมากที่สุดโซลูชั่นการจัดการการพัฒนาสำหรับสถาบันสินเชื่อนี้วิธีการแก้ปัญหาที่ได้รับการพื้นฐานในการอุปโภคบริโภคการจัดการเครดิตตั้งแต่ Durand [1] การทำงานและอยู่ในการแข่งขันเพื่อวันของเรา. ผู้เขียนเช่นเฟลด์แมน [2], โทมัสอัลเอต [3] และซาโพตา [4] กำหนดคะแนนเครดิตเป็นกระบวนการของการกำหนดวิธีการที่น่าจะเป็นผู้สมัครโดยเฉพาะอย่างยิ่งเป็นค่าเริ่มต้นที่มีการชำระหนี้. วิธีการให้คะแนนเครดิตถูกนำมาใช้ในการสั่งซื้อที่จะจัดไปได้ที่เจ้าหนี้ในสองชั้นของความเสี่ยง: ดีและไม่ดี [5] . เหล่านี้วิธีการใช้ตัวแปรอธิบายได้จากการสมัครข้อมูลในการประเมินผลการปฏิบัติงานตั้งใจของเขาที่จะจ่ายคืนเงินกู้ยืม จำนวนมากของวิธีการจำแนกสามารถนำมาใช้ในกระบวนการของการระบุพฤติกรรมของผู้กู้ตามที่การตัดสินใจของต้นไม้[6], เครือข่ายประสาท [7], วิเคราะห์จำแนก [8] [9] การถดถอยโลจิสติก [10] [11] . . ทั้งสองเทคนิคเหล่านี้สามารถให้การเลือกปฏิบัติที่ดี แต่วิธีการที่ใช้บ่อยที่สุดสำหรับการสร้างดัชนีชี้วัด(เช่นเครดิตรุ่น) มีการวิเคราะห์จำแนกและการถดถอยโลจิสติก. การถดถอยโลจิสติกเป็นเทคนิคที่เหมาะสมสำหรับเครดิตกรณีการให้คะแนน [12] พัดลมและวัง [13] และ Sautory et al. [14] แนะนำการใช้งานของการถดถอยโลจิสติกไบนารีในกรณีที่คะแนนเครดิตเมื่อโปรแกรมประยุกต์การวิเคราะห์จำแนกเงื่อนไขที่ไม่ได้หาได้ ทางเลือกนี้กลายเป็นความจำเป็นหากตัวแปรเชิงคุณภาพได้รับการมีส่วนร่วมในรูปแบบ [15]. ข้อมูลเกี่ยวกับผู้สมัครที่มีจำหน่ายเครดิตวัสดุพื้นฐานองค์ประกอบในการยอมรับการร้องขอเครดิตของเขาข้อมูลขาดvalorization ความเสี่ยงด้านเครดิตเป็นผู้ต้องสงสัยที่จะนำไปสู่การที่ไม่ถูกต้องในการตัดสินใจ ในบทความนี้เราจะมุ่งเน้นในการให้สินเชื่อการประเมินผลการให้คะแนนโดยใช้เทคนิคการถดถอยโลจิสติกเมื่อประชากรที่น่าสนใจที่โดดเด่นด้วยขนาดที่เล็ก. พฤติกรรมของผู้กู้มีการอธิบายโดยตัวแปรเป้าหมายไบนารีแสดง Y ค่าดำเนินการโดยคนสุดท้ายนี้วัสดุพื้นฐานองค์ประกอบในการตัดสินใจให้สินเชื่อ ', y = 0 เมื่อผู้กู้นำเสนอปัญหาและy = 1 เป็นอย่างอื่น นอกจากตัวแปรนี้ผู้กู้ทุกนอกจากนี้ยังมีการอธิบายโดยชุดของตัวแปรคำอธิบาย(X1, X2,..., Xd) แจ้งเกี่ยวกับการกู้และเกี่ยวกับบัญชีของเขาทำงาน. ตัวอย่างของเงินกู้ยืมผลผู้สมัครจากที่แตกต่างกันของประชากรที่เกิดขึ้นจากลูกค้าผู้กู้และอื่น ๆ ที่ไม่ได้ ที่นี่เราจัดการกับปัญหาของการเลือกปฏิบัติในกรณีที่ประชากรของส่วนผสมที่สองประชากรเป็นลำดับ: ผู้กู้ลูกค้าและผู้กู้ที่ไม่ใช่ลูกค้า อย่างแม่นยำมากขึ้นเราจะเน้นลูกค้าที่ไม่ subpopulation การประเมินความคุ้มค่าเครดิตสมมติว่าขนาดของกลุ่มตัวอย่างของsubpopulation นี้ถือว่าอ่อนแอ. เริ่มต้นด้วยสมมติฐานที่ว่าขนาดของประชากรเป็นหนึ่งในปัจจัยที่สำคัญที่สุดที่มีผลต่ออำนาจการจำแนกประเภทของเทคนิคการถดถอยโลจิสติกเราประเมินลูกค้าในอนาคต(เช่นลูกค้าไม่) พฤติกรรมที่จะจ่ายคืนเงินกู้โดยการมองหาวิธีการแก้ปัญหาที่มีประสิทธิภาพในการแก้ไขปัญหาของลูกค้าที่ไม่เล็กขนาดของกลุ่มตัวอย่าง. เราดำเนินการตรวจสอบวิธีการใช้ข้อมูลในมือของลูกค้าของผู้กู้และลูกค้าที่ไม่สามารถมีประสิทธิภาพ. วิธีแรกที่ใช้โดยทั่วไปธนาคารประกอบด้วยในการใช้รูปแบบการกู้ลูกค้าทำนายการทำนายกู้พฤติกรรมที่ไม่ใช่ลูกค้า แต่ก็ไม่ได้คำนึงถึงความแตกต่างระหว่างสองประชากร. อีกวิธีหนึ่งในการใช้ประกอบการเรียนรู้ตัวอย่างที่เกิด
การแปล กรุณารอสักครู่..
ผมแนะนำ
สินเชื่อคือความเสี่ยงหลักที่สถาบันสินเชื่อ
ต้องจัดการ ความเสี่ยงนี้เกิดขึ้นเมื่อผู้กู้
ไม่จ่ายหนี้ของเขาในการแก้ไข เนื่องจาก หน้านี้ชนิดของ
ความเสี่ยง ผู้จัดการธนาคารต้องมองหาโซลูชั่นที่มีประสิทธิภาพ
ดีแยกแยะดีจากผู้สมัครที่มีคะแนนเครดิตไม่ดี
เป็นหนึ่งในความสำเร็จมากที่สุดความเสี่ยงทางการเงิน
โซลูชั่นการจัดการพัฒนาสถาบันสินเชื่อ , โซลูชั่นนี้
ได้รับพื้นฐานในการจัดการสินเชื่อผู้บริโภค
ตั้งแต่ดูแรนด์ [ 1 ] งานและยังคงแข่งขันวัน .
เขียนเหมือน เฟลด์แมน [ 2 ] , โทมัส et al . [ 3 ] และน ซาปอร์ต้า [ 4 ]
กำหนดเครดิตการให้คะแนนเป็นกระบวนการของการกำหนดวิธีการที่น่าจะเป็นผู้สมัครโดยเฉพาะ
เริ่มต้นด้วยการชำระคืนการให้คะแนนเครดิตเป็นวิธีที่ใช้เพื่อแยกประเภทเจ้าหนี้เป็นไปได้
2 ชั้นเรียนของความเสี่ยง : ดีและไม่ดี [ 5 ] วิธีการเหล่านี้ใช้ตัวแปรที่ได้จากการ
เพื่อประเมินข้อมูลผู้สมัครของเขาเป้าหมายการปฏิบัติงานจ่ายเงินกู้คืน
เป็นจำนวนมากของวิธีการจำแนกสามารถใช้
ในกระบวนการระบุพฤติกรรมผู้กู้ ' การตัดสินใจ
ต้นไม้ [ 6 ] , โครงข่ายประสาทเทียม [ 7 ]การวิเคราะห์จำแนก [ 8 ] , [ 9 ] ,
ถดถอยโลจิสติก [ 10 ] [ 11 ] . . . . . . .
ทั้งเทคนิคเหล่านี้สามารถให้ดี เลือกปฏิบัติ แต่ที่พบมากที่สุดที่ใช้สำหรับวิธี
สำหรับอาคาร ( เช่นรุ่นเครดิต
) และการวิเคราะห์ถดถอยโลจิสติก .
ถดถอยโลจิสติกเป็นเทคนิคที่เหมาะสมสำหรับกรณีการให้คะแนนเครดิต
[ 12 ] พัดลมและวัง [ 13 ] และ sautory et al .
[ 14 ] แนะนำการใช้งานของการถดถอยโลจิสติกทวิภาคใน
เครดิตกรณีคะแนน เมื่อจำแนกการวิเคราะห์โปรแกรม
เงื่อนไขไม่หาได้ . ตัวเลือกนี้จะกลายเป็นขวาง
ถ้าตัวแปรเชิงคุณภาพได้รับเกี่ยวข้องในรูปแบบ [ 15 ] .
ของข้อมูลเกี่ยวกับสินเชื่อผู้สมัครวัสดุพื้นฐาน องค์ประกอบในการขอสินเชื่อของเขา
ข้อมูลขาด valorization ความเสี่ยงเครดิตเป็นผู้นำผิด
การตัดสินใจ ในบทความนี้เราจะมุ่งเน้นในเครดิต
คะแนนการประเมินผลโดยใช้เทคนิคการถดถอยโลจิสติกเมื่อ
ประชากรที่น่าสนใจ เป็นลักษณะขนาดเล็ก พฤติกรรมของผู้กู้จะอธิบายโดยสองตัวแปร y
เขียนเป้าหมาย ค่าถ่ายโดยคนล่าสุดวัสดุพื้นฐาน
องค์ประกอบในการตัดสินใจอนุญาตให้เครดิต ' , y = 0 เมื่อ
กู้นำเสนอปัญหาและ y = 1 เป็นอย่างอื่น นอกจาก
ตัวแปรนี้ ทุกผู้กู้ยังอธิบายโดยชุดของ
ตัวแปรอธิบาย ( x1 , x2 , . . . . . . . . 5 ) แจ้งเกี่ยวกับเรื่องบัญชีผู้กู้ และ
' ของเขาทำงาน ตัวอย่างของเงินให้สินเชื่อ ' ผู้สมัครผลลัพธ์จากข้อมูลประชากรเกิดขึ้นโดยผู้กู้และ
ลูกค้าคนอื่นไม่ ที่นี่เราจัดการกับปัญหาของการเลือกปฏิบัติ
ในกรณีของแต่ละ ' ส่วนผสมที่ 2
สองตามลำดับ : กู้และกู้ลูกค้า
' ไม่ใช่ลูกค้า ยิ่งกว่านั้น เราจะโฟกัส
ลูกค้า subpopulation การประเมินเครดิตไม่ ,
สมมติว่าขนาดตัวอย่าง subpopulation
ถือว่าอ่อนแอเริ่มต้นด้วยสมมติฐานที่ว่า ขนาดของประชากรเป็นหนึ่งในปัจจัยที่สำคัญที่สุดที่มีผลต่อ
เทคนิคการจำแนกอำนาจถดถอยโลจิสติก เราประเมิน
ลูกค้าในอนาคต ( คือไม่ใช่ลูกค้า ) พฤติกรรมที่จะจ่ายเงินกู้กลับ โดยดู
สำหรับโซลูชั่นที่มีประสิทธิภาพในปัญหาของลูกค้าไม่เล็ก
เราขนาดตัวอย่าง ดำเนินการสืบสวน วิธีการใช้ข้อมูลในมือ
มุมมองของลูกค้าและลูกค้าไม่สามารถมีประสิทธิภาพ .
วิธีการแรก ซึ่งโดยทั่วไปที่ใช้โดยธนาคาร ประกอบด้วย
ใช้กู้ลูกค้ารูปแบบการทำนาย เพื่อพยากรณ์
กู้ปลอดลูกค้า พฤติกรรม อย่างไรก็ตาม , มันไม่ได้
คำนึงถึง ความแตกต่างระหว่างสองสอง .
วิธีอื่นประกอบด้วยการใช้ตัวอย่างที่เป็นผลการเรียนรู้
การแปล กรุณารอสักครู่..