In our GA, each individual in the p

In our GA, each individual in the population stores rewards for each of the eight actions that can be performed by the scheduler. Initially, these rewards are randomly generated. We evaluate our initial population by conducting execution-driven simulations with each individual’s memory scheduler configuration, using a small subset of our application set5 and determining the fitness of each individual. The fitness-based selection criteria that we use is tournament selection combined with elitist selection [23, 19]. To perform crossover, we randomly pick two individuals and swap the reward values of an action. Mutation is performed by randomly replacing the reward of an action with another value. Multiple-point crossover and mutations are performed in our experiments, which means that reward values can be swapped or replaced multiple times within a given individual. Once we have the population set for the next generation, it is evaluated against the fitness criteria, and this iterative evolutionary search process continues until we reach 50 generations, at the end of which we are left with a set of rewards, one per possible action, which together constitute our reward function. per possible action, which together constitute our reward function.

0/5000

จาก: -

เป็น: -

ผลลัพธ์ (ไทย) 1: [สำเนา]

คัดลอก!

ใน ga ของเราในแต่ละร้านค้าที่ประชากรรางวัลสำหรับแต่ละแปดกระทำที่สามารถดำเนินการโดยการจัดตารางเวลา ในขั้นต้นผลตอบแทนเหล่านี้ถูกสร้างขึ้นแบบสุ่ม เราประเมินประชากรของเราเริ่มต้นโดยการดำเนินการจำลองการดำเนินการที่ขับเคลื่อนด้วยกับแต่ละโ€หน่วยความจำกำหนดการ confi ย guration,ใช้เซตย่อยขนาดเล็ก set5 โปรแกรมของเราและการกำหนด tness สายยของแต่ละบุคคล สายย tness ตามเกณฑ์การคัดเลือกที่เราใช้ในการเลือกทัวร์นาเมนต์รวมกับการเลือกชั้นนำ [23, 19] เพื่อดำเนินการครอสโอเวอร์เราสุ่มเลือกสองบุคคลและสลับค่าตอบแทนของการกระทำ การกลายพันธุ์จะดำเนินการโดยการสุ่มเปลี่ยนรางวัลของการกระทำที่มีค่าอื่นครอสโอเวอร์หลายจุดและการกลายพันธุ์ที่จะดำเนินการในการทดลองของเราซึ่งหมายความว่าค่าตอบแทนที่สามารถสลับหรือเปลี่ยนใหม่หลายครั้งในแต่ละที่กำหนด กระบวนการค้นหาเมื่อเรามีประชากรที่ตั้งไว้สำหรับคนรุ่นต่อไปก็จะถูกประเมินเทียบกับสายย tness เกณฑ์และเรื่องนี้ซ้ำแล้วซ้ำอีกวิวัฒนาการต่อไปจนกว่าเราไปถึง 50 รุ่น,ในตอนท้ายของการที่เราจะทิ้งให้อยู่กับชุดของรางวัลอย่างใดอย่างหนึ่งต่อการกระทำที่เป็นไปได้ซึ่งรวมเป็นฟังก์ชั่นได้รับรางวัลของเรา ต่อการกระทำที่เป็นไปได้ซึ่งรวมเป็นฟังก์ชั่นได้รับรางวัลของเรา

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 2:[สำเนา]

คัดลอก!

ใน GA ของเรา แต่ละคนในประชากรเก็บรางวัลสำหรับแต่ละการดำเนินการ 8 ที่สามารถดำเนินการ โดยตัวจัดกำหนดการ ครั้งแรก รางวัลเหล่านี้จะสุ่มสร้างขึ้น เราประเมินประชากรของเราเริ่มต้น ด้วยการจำลองการดำเนินการขับเคลื่อนทำกับแต่ละคนจำกำหนดการ confi guration ใช้ชุดย่อยขนาดเล็กของ set5 แอพลิเคชันของเรา และกำหนด tness ไร้สายของแต่ละบุคคล เกณฑ์การเลือกใช้ tness ไร้สายที่เราใช้เป็นตัวเลือกการแข่งขันพร้อมกับเลือก elitist [23, 19] ทำแบบไขว้ เราสุ่มรับบุคคลที่สอง และสลับค่าสะสมของการดำเนินการ ดำเนินการกลายพันธุ์ โดยสุ่มแทนรางวัลของการดำเนินการกับค่าอื่น หลายจุดไขว้และกลายพันธุ์ดำเนินการในการทดลองของเรา ซึ่งหมายความ ว่า ค่าตอบแทนสามารถสลับ หรือเปลี่ยนหลายครั้งในแต่ละคนให้ เมื่อเรามีประชากรตั้งสำหรับรุ่นต่อไป ถูกประเมินกับเกณฑ์ tness ไร้สาย และกระบวนการนี้ซ้ำค้นหาวิวัฒนาการอย่างต่อเนื่องจนกว่าเราถึงรุ่น 50 ท้ายที่เราจะเหลือไว้กับชุดของรางวัล หนึ่งต่อการดำเนินการได้ ซึ่งร่วมกันเป็นฟังก์ชันของรางวัล ต่อการดำเนินการได้ ซึ่งร่วมกันเป็นฟังก์ชันของรางวัล

การแปล กรุณารอสักครู่..

ผลลัพธ์ (ไทย) 3:[สำเนา]

คัดลอก!

ใน, GA ของแต่ละคนแต่ละคนในร้านค้าจำนวนประชากรที่รับรางวัลสำหรับแปดสิ่งที่สามารถทำได้โดยที่แต่ละตัวจัดตารางเวลา รางวัลในครั้งแรกนี้มีสร้างขึ้นโดยการสุ่ม เราประเมินประชากรครั้งแรกของเราโดยการจำลองการประมวลผล - ขับรถพร้อมด้วยของหน่วยความจำแต่ละตัวจัดตารางเวลา confi กำหนดโครงแบบการใช้ชุดย่อยขนาดเล็กของแอปพลิเคชันของเราตั้ง 5 และการกำหนด ไฟร์ tness ของแต่ละคน เกณฑ์ในการ เลือก tness - ใช้ไฮน์ไฟร์ที่เราใช้เป็นทางเลือกทัวร์นาเมนต์ประกอบด้วยการเลือกเกมส์หนักๆ[ 2319 ] ในการครอสโอเวอร์เราแบบสุ่มเลือกสองแบบเฉพาะรายและ hot swap ค่าเงินรางวัลของการดำเนินการที่ คือมันจะดำเนินการโดยสุ่มการใส่เงินรางวัลที่ได้รับจากการกระทำที่มีค่าอื่นท่าพิคอัพแล้วครอสโอเวอร์เข้าไปเปลี่ยนแปลงรหัสและหลายจุดมีได้ดำเนินการในการทดลองของเราซึ่งหมายความว่าค่าเงินรางวัลสามารถสลับหรือเปลี่ยนได้หลายครั้งในแบบเฉพาะรายได้ เมื่อเรามีประชากรที่ตั้งค่าไว้สำหรับรุ่นถัดไปที่จะได้รับการประเมินผลเปรียบเทียบกับเกณฑ์ ไฟร์ tness และขั้นตอนการค้นหาฝึกฝนตามวิวัฒนาการนี้จะยังคงดำเนินต่อไปจนกว่าเราจะได้เข้าถึงยัง 50 รุ่นในตอนท้ายของเราจะมีการทิ้งพร้อมด้วยชุดของพรีเมียร์หนึ่งต่อการดำเนินการเป็นไปได้ซึ่งร่วมกันทำงานเป็นรางวัลของเราต่อการดำเนินการเป็นไปได้ซึ่งร่วมกันทำงานเป็นรางวัลของเรา

การแปล กรุณารอสักครู่..

ภาษาอื่น ๆ

การสนับสนุนเครื่องมือแปลภาษา: กรีก, กันนาดา, กาลิเชียน, คลิงออน, คอร์สิกา, คาซัค, คาตาลัน, คินยารวันดา, คีร์กิซ, คุชราต, จอร์เจีย, จีน, จีนดั้งเดิม, ชวา, ชิเชวา, ซามัว, ซีบัวโน, ซุนดา, ซูลู, ญี่ปุ่น, ดัตช์, ตรวจหาภาษา, ตุรกี, ทมิฬ, ทาจิก, ทาทาร์, นอร์เวย์, บอสเนีย, บัลแกเรีย, บาสก์, ปัญจาป, ฝรั่งเศส, พาชตู, ฟริเชียน, ฟินแลนด์, ฟิลิปปินส์, ภาษาอินโดนีเซี, มองโกเลีย, มัลทีส, มาซีโดเนีย, มาราฐี, มาลากาซี, มาลายาลัม, มาเลย์, ม้ง, ยิดดิช, ยูเครน, รัสเซีย, ละติน, ลักเซมเบิร์ก, ลัตเวีย, ลาว, ลิทัวเนีย, สวาฮิลี, สวีเดน, สิงหล, สินธี, สเปน, สโลวัก, สโลวีเนีย, อังกฤษ, อัมฮาริก, อาร์เซอร์ไบจัน, อาร์เมเนีย, อาหรับ, อิกโบ, อิตาลี, อุยกูร์, อุสเบกิสถาน, อูรดู, ฮังการี, ฮัวซา, ฮาวาย, ฮินดี, ฮีบรู, เกลิกสกอต, เกาหลี, เขมร, เคิร์ด, เช็ก, เซอร์เบียน, เซโซโท, เดนมาร์ก, เตลูกู, เติร์กเมน, เนปาล, เบงกอล, เบลารุส, เปอร์เซีย, เมารี, เมียนมา (พม่า), เยอรมัน, เวลส์, เวียดนาม, เอสเปอแรนโต, เอสโทเนีย, เฮติครีโอล, แอฟริกา, แอลเบเนีย, โคซา, โครเอเชีย, โชนา, โซมาลี, โปรตุเกส, โปแลนด์, โยรูบา, โรมาเนีย, โอเดีย (โอริยา), ไทย, ไอซ์แลนด์, ไอร์แลนด์, การแปลภาษา.