What we'd like is to find where CC

What we'd like is to find where CC achieves its global minimum. Now, of course, for the function plotted above, we can eyeball the graph and find the minimum. In that sense, I've perhaps shown slightly too simple a function! A general function, CC, may be a complicated function of many variables, and it won't usually be possible to just eyeball the graph to find the minimum.

One way of attacking the problem is to use calculus to try to find the minimum analytically. We could compute derivatives and then try using them to find places where CC is an extremum. With some luck that might work when CC is a function of just one or a few variables. But it'll turn into a nightmare when we have many more variables. And for neural networks we'll often want far more variables - the biggest neural networks have cost functions which depend on billions of weights and biases in an extremely complicated way. Using calculus to minimize that just won't work!

(After asserting that we'll gain insight by imagining CC as a function of just two variables, I've turned around twice in two paragraphs and said, "hey, but what if it's a function of many more than two variables?" Sorry about that. Please believe me when I say that it really does help to imagine CC as a function of two variables. It just happens that sometimes that picture breaks down, and the last two paragraphs were dealing with such breakdowns. Good thinking about mathematics often involves juggling multiple intuitive pictures, learning when it's appropriate to use each picture, and when it's not.)

One way of attacking the problem is to use calculus to try to find the minimum analytically. We could compute derivatives and then try using them to find places where CC is an extremum. With some luck that might work when CC is a function of just one or a few variables. But it'll turn into a nightmare when we have many more variables. And for neural networks we'll often want far more variables - the biggest neural networks have cost functions which depend on billions of weights and biases in an extremely complicated way. Using calculus to minimize that just won't work!

(After asserting that we'll gain insight by imagining CC as a function of just two variables, I've turned around twice in two paragraphs and said, "hey, but what if it's a function of many more than two variables?" Sorry about that. Please believe me when I say that it really does help to imagine CC as a function of two variables. It just happens that sometimes that picture breaks down, and the last two paragraphs were dealing with such breakdowns. Good thinking about mathematics often involves juggling multiple intuitive pictures, learning when it's appropriate to use each picture, and when it's not.)

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

สิ่งที่เราอยากจะหาที่ CC ให้ค่าต่ำสุดของโลก ตอนนี้ แน่นอน ฟังก์ชันพล็อตข้างต้น เราสามารถ eyeball กราฟ และพบต่ำสุด ในแง่ที่ว่า ผมอาจจะแสดงเล็กน้อยฟังก์ชันธรรมดาเกินไป ฟังก์ชั่นทั่วไป CC อาจจะซับซ้อนฟังก์ชันหลายตัวแปร และจะไม่มักจะเป็นไปได้ในเพียง eyeball กราฟเพื่อหาขั้นต่ำวิธีหนึ่งของการโจมตีปัญหาคือการ ใช้แคลคูลัสหาขั้นต่ำ analytically เราสามารถคำนวณอนุพันธ์ และลองใช้ในการค้นหาสถาน extremum CC กับโชคบางอย่าง ที่อาจทำงานเมื่อ CC เป็นฟังก์ชันของตัวแปรเพียงหนึ่ง หรือสองสาม แต่มันจะกลายเป็นฝันร้ายเมื่อมีตัวแปรเพิ่มเติมจำนวนมาก และเครือข่ายประสาทที่เรามักจะต้องไกลตัวแปรเพิ่มเติม - เครือข่ายประสาทใหญ่ที่สุดมีฟังก์ชั่นต้นทุนซึ่งขึ้นอยู่พันน้ำหนักและอคติกับในวิธีที่มีความซับซ้อนมาก การใช้แคลคูลัสเพื่อลดที่เพียงแค่จะไม่ทำงาน(หลังจากยืนยันว่า เราจะเข้าใจ โดยจินตนาการ CC เป็นฟังก์ชันของตัวแปรเพียงสอง ผมเคยเปิดรอบสองในย่อหน้าที่สอง และกล่าว ว่า, "เฮ้ แต่ถ้ามันเป็นฟังก์ชันหลายตัวแปรมากกว่าสอง? " ขออภัยเกี่ยวกับที่ โปรดเชื่อฉันเมื่อฉันบอกว่า มันจริง ๆ ช่วยจินตนาการ CC เป็นฟังก์ชันของตัวแปรที่สอง มันก็เกิดว่า บางครั้งภาพที่แบ่ง และย่อหน้าสองครั้งล่าสุดจัดการกับแจกดังกล่าว คิดดีเกี่ยวกับคณิตศาสตร์มักจะเกี่ยวข้องกับการเล่นกลหลายรูปใช้งานง่าย เรียนรู้เมื่อมันเหมาะสมกับใช้ภาพแต่ละภาพ และเมื่อมันไม่เป็น)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

สิ่งที่เราต้องการคือการหาที่ซีซีประสบความสำเร็จในขั้นต่ำทั่วโลก ตอนนี้แน่นอนสำหรับฟังก์ชั่นพล็อตดังกล่าวข้างต้นเราสามารถกราฟลูกตาและหาขั้นต่ำ ในความรู้สึกที่ฉันได้แสดงให้เห็นว่าอาจจะเล็กน้อยง่ายเกินไปฟังก์ชั่น! ฟังก์ชั่นทั่วไป CC, อาจจะเป็นฟังก์ชั่นที่มีความซับซ้อนของตัวแปรจำนวนมากและมันมักจะไม่ไปได้เพียงแค่ลูกตากราฟเพื่อหาต่ำสุด.

วิธีการหนึ่งของการโจมตีที่เป็นปัญหาในการใช้แคลคูลัสเพื่อพยายามหาต่ำสุดที่วิเคราะห์ . เราสามารถคำนวณอนุพันธ์แล้วลองใช้พวกเขาเพื่อค้นหาสถานที่ที่ CC เป็นเอ็กซ์ กับโชคบางอย่างที่อาจจะทำงานเมื่อ CC เป็นหน้าที่ของเพียงหนึ่งหรือตัวแปรไม่กี่ แต่มันจะกลายเป็นฝันร้ายเมื่อเรามีตัวแปรอื่น ๆ อีกมากมาย และเครือข่ายประสาทเรามักจะต้องการตัวแปรไกลมากขึ้น - โครงข่ายประสาทเทียมที่ใหญ่ที่สุดมีฟังก์ชั่นซึ่งขึ้นอยู่กับพันล้านของน้ำหนักและอคติเสียค่าใช้จ่ายในทางที่ซับซ้อนมาก การใช้แคลคูลัสเพื่อลดการที่เพิ่งจะไม่ทำงาน!

(หลังจากที่ยืนยันว่าเราจะได้รับความเข้าใจด้วยการจินตนาการ CC เป็นหน้าที่ของเพียงสองตัวแปรฉันได้หันไปรอบ ๆ สองครั้งในวรรคสองและกล่าวว่า "Hey, แต่ถ้ามันเป็น ฟังก์ชั่นของอื่น ๆ อีกมากมายกว่าสองตัวแปร? "ขออภัยเกี่ยวกับที่. โปรดเชื่อฉันเมื่อฉันบอกว่าจริงๆมันจะช่วยในการจินตนาการ CC เป็นหน้าที่ของสองตัวแปร. มันก็เกิดขึ้นว่าบางครั้งภาพที่หยุดพักลงและทั้งสองย่อหน้าสุดท้าย มีการจัดการกับความผันผวนดังกล่าว. การคิดที่ดีเกี่ยวกับคณิตศาสตร์มักจะเกี่ยวข้องกับการเล่นกลภาพที่ใช้งานง่ายหลายเรียนรู้เมื่อมันเหมาะสมที่จะใช้ภาพแต่ละภาพและเมื่อมันไม่ได้.)

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

สิ่งที่เราต้องการคือการหาที่ CC บรรลุต่ำสุดของโลก ตอนนี้ แน่นอน สำหรับฟังก์ชันวางแผนข้างต้นเราสามารถลูกตากราฟและหาขั้นต่ำ ในความรู้สึกนั้น ฉันอาจแสดงเล็กน้อยง่ายเกินไปฟังก์ชั่น ! ทั่วไปของฟังก์ชัน , ซีซี , อาจเป็นฟังก์ชันของตัวแปรที่ซับซ้อนมาก และมันก็มักจะเป็นไปได้ที่จะแค่ลูกตากราฟหาขั้นต่ำวิธีการหนึ่งของการโจมตีปัญหาคือการใช้แคลคูลัสเพื่อพยายามหาขั้นวิเคราะห์ . เราสามารถคำนวณอนุพันธ์แล้ว ลองใช้ค้นหาสถานที่ที่ CC เป็น extremum . กับโชคบางอย่างที่อาจจะทำงานเมื่อ CC เป็นฟังก์ชันของเพียงหนึ่งหรือหลายตัวแปร แต่มันก็กลายเป็นฝันร้าย เมื่อเรามีหลายตัวแปร และโครงข่ายประสาทเทียม เรามักจะต้องการมากขึ้น ด้านข่ายงานที่ใหญ่ที่สุดมีต้นทุนในการทำงาน ซึ่งขึ้นอยู่กับพันล้านของน้ำหนักและอคติในทางที่ซับซ้อนมาก . ใช้แคลคูลัสเพื่อลดที่เพียงไม่ทำงาน !( หลังจากที่ยืนยันว่าเราจะได้ข้อมูลเชิงลึก โดย imagining CC เป็นฟังก์ชันสองตัวแปร ฉันหันไปรอบ ๆสองครั้งในย่อหน้าสองและกล่าวว่า " เฮ้ แต่ถ้ามันเป็นฟังก์ชันของตัวแปรหลายมากกว่าสอง ขอโทษด้วยครับ โปรดเชื่อฉันเมื่อฉันกล่าวว่าจริงๆมันจะช่วยให้จินตนาการ CC เป็นฟังก์ชันสองตัวแปร มันเกิดขึ้นว่า บางครั้งภาพที่หยุดพักลงและสุดท้ายสองย่อหน้า ซื้อขายดังกล่าวเสีย ความคิดที่ดีเกี่ยวกับคณิตศาสตร์มักจะเกี่ยวข้องกับการเล่นกลหลายที่ใช้งานง่ายภาพการเรียนรู้เมื่อมันเหมาะสมที่จะใช้ในแต่ละภาพ และเมื่อมันไม่ได้ )

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.