Triplet SamplingTo avoid overfittin

Triplet Sampling
To avoid overfitting, it is desirable to utilize a large variety of images. However, the number of possible triplets
increases cubically with the number of images. It is computationally prohibitive and sub-optimal to use all the triplets.
For example, the training dataset in this paper contains 12
million images. The number of all possible triplets in this
dataset is approximately (1.2× 107)3 = 1.728× 1021. This
is an extermely large number that can not be enumerated.
If the proposed triplet sampling algorithm is employed, we
find the optimization converges with about 24 million triplet
samples, which is a lot smaller than the number of possible
triplets in our dataset.
It is crucial to choose an effective triplet sampling strategy to select the most important triplets for rank learning.
Uniformly sampling of the triplets is sub-optimal, because
we are more interested in the top-ranked results returned by
the ranking model. In this paper, we employ an online importance sampling scheme to sample triplets.
Suppose we have a set of images P, and their pairwise
relevance scores r
i,j = r(pi, pj). Each image pi belongs to
a category, denoted by ci. Let the total relevance score of
an image ri defined as
ri = X
j:cj=ci,j6=i
ri,j (6)
The total relevance score of an image pi reflects how relevant the image is in terms of its relevance to the other images in the same category.
To sample a triplet, we first sample a query image pi
from P according to its total relevance score. The probability of an image being chosen as query image is proportional
to its total relevance score.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

แฝดสามสุ่มตัวอย่างเพื่อหลีกเลี่ยงการ overfitting น่าจะใช้ประโยชน์จากความหลากหลายของภาพ อย่างไรก็ตาม จำนวนแฝดเป็นไปได้เพิ่มขึ้น cubically กับจำนวนของภาพ มันเป็น computationally ห้ามปราม และย่อยที่เหมาะสมจะใช้กับทั้งหมดตัวอย่าง การฝึกอบรมชุดข้อมูลในเอกสารนี้ประกอบด้วย 12ล้านภาพ จำนวนแฝดเป็นไปได้ทั้งหมดในนี้ชุดข้อมูลคือประมาณ (1.2 × 107) 3 = 1.728 × 1021 นี้มี extermely จำนวนมากที่ไม่สามารถระบุได้ถ้าใช้วิธีการสุ่มตัวอย่างเสนอแฝด เราค้นหาการเพิ่มประสิทธิภาพแร็คกับแฝดประมาณ 24 ล้านตัวอย่าง ซึ่งมีขนาดเล็กกว่าจำนวนไปได้มากกับในชุดข้อมูลของเรามันเป็นสิ่งสำคัญการเลือกสุ่มตัวอย่างกลยุทธ์การเลือกกับสำคัญที่สุดสำหรับการเรียนรู้อันดับแฝดมีประสิทธิภาพสุ่มตัวอย่างอย่างสม่ำเสมอของแฝดเป็นช่วงที่ดีที่สุด เนื่องจากเรามีความสนใจในอันดับต้น ๆ ผลลัพธ์ส่งกลับโดยแบบจัดอันดับ ในกระดาษนี้ เราใช้แบบแผนการสุ่มตัวอย่างความสำคัญออนไลน์ไปกับตัวอย่างสมมติว่า เรามีชุดภาพ P ของแพร์ไวส์r คะแนนความเกี่ยวข้องi, j = r (ค่า pi, pj) เป็นของพี่แต่ละภาพหมวดหมู่ ระบุ โดย ci ให้คะแนนความเกี่ยวข้องทั้งหมดของri กำหนดเป็นรูปภาพri = Xj:cj = ci, j6 =ฉันri, j (6)คะแนนความเกี่ยวข้องทั้งหมดของพี่มีภาพสะท้อนเป็นภาพเกี่ยวข้องในแง่ของความสัมพันธ์ของเนื้อหากับภาพอื่น ๆ ในประเภทเดียวกันเพื่อตัวอย่างในทารก เราครั้งแรกตัวอย่างปี่ภาพแบบสอบถามจาก P ตามคะแนนความเกี่ยวข้องทั้งหมด ความน่าเป็นของรูปภาพที่ถูกเลือกเป็นสัดส่วนภาพแบบสอบถามคะแนนความเกี่ยวข้องทั้งหมด

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

Triplet สุ่มตัวอย่าง
เพื่อหลีกเลี่ยงการอิงก็เป็นที่พึงปรารถนาที่จะใช้ประโยชน์จากความหลากหลายของภาพ อย่างไรก็ตามจำนวนของแฝดที่เป็นไปได้
เพิ่ม cubically กับจำนวนภาพ มันเป็นคอมพิวเตอร์ห้ามปรามและย่อยที่ดีที่สุดที่จะใช้แฝดทั้งหมด.
ตัวอย่างเช่นชุดการฝึกอบรมในกระดาษนี้มี 12
ล้านภาพ จำนวนแฝดที่เป็นไปได้ทั้งหมดในครั้งนี้มี
ชุดข้อมูลจะอยู่ที่ประมาณ (1.2 × 107) 3 = 1.728 × 1021. นี้
เป็นจำนวนมาก extermely ที่ไม่สามารถแจกแจง.
หากขั้นตอนวิธีการสุ่มตัวอย่างแฝดที่นำเสนอเป็นลูกจ้างเรา
พบว่าการเพิ่มประสิทธิภาพลู่เกี่ยวกับ 24 ล้านแฝด
ตัวอย่างซึ่งเป็นจำนวนมากที่มีขนาดเล็กกว่าจำนวนที่เป็นไปได้
สามในชุดของเรา.
มันเป็นสิ่งสำคัญที่จะเลือกกลยุทธ์แฝดสุ่มตัวอย่างมีประสิทธิภาพในการเลือกแฝดที่สำคัญที่สุดสำหรับการเรียนรู้ยศ.
การสุ่มตัวอย่างอย่างสม่ำเสมอแฝดคือย่อยที่ดีที่สุด, เพราะ
เรามีความสนใจมากขึ้นในผลการติดอันดับกลับโดย
รูปแบบการจัดอันดับ ในบทความนี้เราจ้างโครงการสำคัญสุ่มตัวอย่างออนไลน์ที่จะลิ้มลองแฝด.
สมมติว่าเรามีชุดของภาพ P และคู่ของพวกเขา
มีคะแนนความสัมพันธ์กัน r
I, J = R (PI, PJ) Pi ภาพแต่ละภาพเป็น
หมวดหมู่ให้แสดงโดย CI ให้คะแนนความสัมพันธ์กันทั้งหมดของ
ri ภาพกำหนดเป็น
RI = X
J: CJ = CI, J6 = ฉัน
ri, J (6)
คะแนนความสัมพันธ์กันทั้งหมดของ Pi ภาพสะท้อนให้เห็นถึงความเกี่ยวข้องของภาพที่เป็นในแง่ของความเกี่ยวข้องกับ ภาพอื่น ๆ ในประเภทเดียวกัน.
ที่จะลิ้มลองแฝดเป็นครั้งแรกที่เราลิ้มลอง Pi ภาพแบบสอบถาม
จาก P ตามคะแนนความเกี่ยวข้องทั้งหมด ความน่าจะเป็นของภาพที่ถูกเลือกให้เป็นภาพแบบสอบถามเป็นสัดส่วน
คะแนนความเกี่ยวข้องทั้งหมด

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.