Control of locomotion in legged robots is a challenging
multidimensional control problem[6, 2]. It requires
the specification and coordination of motions in
all robots’ legs while considering factors such as stability
and surface friction[14]. This is a research area
which has obvious ties with the control of animal locomotion,
and it is a suitable task to use to explore this
issue[23]. It has been a research area for a considerable
period of time, from the first truly independent
legged robots like the Phony Pony built by Frank and
McGhee[17], where each joint was controlled by a simple
finite state machine, to the very successful algorithmic
control of bipeds and quadrupeds by Raibert[22].
Lewis[16] evolved controllers for a hexapod robot,
where the controller was evaluated on a robot which
learn to walk inspired on insect-like gaits, after a staged
evolution where its behavior was shaped toward the fi-
nal goal of walking. Bongard[3] evolved the parameters
of a dynamic neural network to control various types of
simulated robots. Busch[5] used genetic programming
to evolve the control parameters of several robot types.
Jacob[13], on the other hand, used reinforcement learning
to control a simulated tetrapod robot.
In these previous cited research works, when they involved
solutions based on neurons, they all used only the
topology of a neural network, but not the learning algorithms
based on gradient descend, like back-propagation
and its improvements. One of the techniques most used
to adjust the neural weights are the genetic algorithms
(GA)[8, 18], because they do not need local information
for the error minimization, nor the gradient calculation.
This is very useful in the robot control, because it is very
difficult to have some training data for the supervised
learning.
In our previous work[11, 12], we used genetic algorithms
[8] to automatically generate a finite state machine
to control simulated legged robots with four and
six legs. Despite of its advantages, genetic algorithms
are a machine learning method[19] not much suitable
for the control generation of legged robots, because the
time spent to evolve the parameters is very long[26].
For this reason, we decided to use a supervised learning
method to adjust the neural weights, more specifi-
cally, we adopted the RPROP algorithm[24]. This training
method is more efficient than the evolutionary methods,
and it is more robust faced to non expected situations
than hand tuned methods.
ควบคุม locomotion ในหุ่นยนต์ขาเปลือยเป็นการท้าทายปัญหาในการควบคุมมิติ [6, 2] ต้องการข้อกำหนดและประสานงานการเคลื่อนไหวในขาของหุ่นยนต์ทั้งหมดโดยพิจารณาถึงปัจจัยต่าง ๆ เช่นความมั่นคงและแรงเสียดทานพื้นผิว [14] นี้เป็นพื้นที่วิจัยซึ่งมีความสัมพันธ์ที่ชัดเจนกับการควบคุมสัตว์ locomotionและมันเป็นงานที่เหมาะสมเพื่อใช้ในการสำรวจนี้ปัญหา [23] จะได้รับการวิจัยพื้นที่เป็นจำนวนมากรอบระยะเวลาของเวลา จากแรกเป็นอิสระอย่างแท้จริงหุ่นยนต์ขาเปลือยเช่นม้า Phony สร้าง โดยแฟรงก์ และMcGhee [17], ซึ่งแต่ละร่วมถูกควบคุม โดยเรียบง่ายเครื่องสถานะจำกัด การประสบความสำเร็จมาก algorithmicควบคุม bipeds และ quadrupeds โดย Raibert [22]ลูอิส [16] พัฒนาตัวควบคุมสำหรับหุ่นยนต์ hexapodตัวควบคุมที่ถูกประเมินในหุ่นยนต์ซึ่งเดินแรงบันดาลใจในแมลงเช่น gaits หลังจากที่กำหนดวิวัฒนาการที่มีรูปลักษณะการทำงานของต่อไร้สาย-เป้าหมาย nal การเดิน Bongard [3] พัฒนาพารามิเตอร์ของเครือข่ายประสาทแบบไดนามิกเพื่อควบคุมชนิดต่าง ๆหุ่นยนต์เลียนแบบการ บุชค์ราคา [5] ใช้โปรแกรมทางพันธุกรรมการพัฒนาพารามิเตอร์การควบคุมของหุ่นยนต์ชนิดต่าง ๆยาโคบ [13], ในทางกลับกัน ใช้เหล็กเสริมเรียนรู้การควบคุมหุ่นยนต์ tetrapod จำลองในก่อนหน้านี้อ้างงานวิจัย เมื่อพวกเขาเกี่ยวข้องโซลูชั่นตาม neurons พวกเขาทั้งหมดใช้เฉพาะโทโพโลยีของเครือข่ายประสาท แต่ไม่อัลกอริทึมการเรียนรู้ตามไล่ระดับมา เช่นเผยแพร่กลับและการปรับปรุง เทคนิคที่ใช้มากที่สุดอย่างใดอย่างหนึ่งการปรับ น้ำหนักประสาทเป็นอัลกอริทึมทางพันธุกรรม(GA) [8, 18], เพราะพวกเขาไม่ต้องข้อมูลท้องถิ่นสำหรับการลดข้อผิดพลาด หรือการคำนวณไล่โทนสีนี้เป็นประโยชน์อย่างมากในการควบคุมหุ่นยนต์ เพราะมากยากที่จะมีบางข้อมูลการฝึกอบรมสำหรับการมีเรียนรู้ในงานของเราก่อนหน้านี้ [11, 12], เราใช้อัลกอริทึมทางพันธุกรรม[8] เพื่อสร้างเครื่องสถานะจำกัดโดยอัตโนมัติการควบคุมหุ่นยนต์ขาเปลือยจำลองกับสี่ และหกขา มีข้อดีของ อัลกอริทึมทางพันธุกรรมเครื่องจักรกำลังเรียนรู้วิธี [19] ไม่มากเหมาะสมหรือไม่สำหรับการสร้างหุ่นยนต์ขาเปลือย ควบคุมเนื่องจากการเวลาชุมนุมพารามิเตอร์ยาวมาก [26]ด้วยเหตุนี้ เราตัดสินใจที่จะใช้การเรียนรู้ที่มีวิธีการปรับประสาทน้ำหนัก เพิ่มเติม specifi-cally เรานำขั้นตอนวิธี RPROP [24] การฝึกอบรมนี้วิธีมีประสิทธิภาพมากขึ้นกว่าวิธีวิวัฒนาการและแข็งแกร่งมากขึ้นประสบกับสถานการณ์ที่คาดไม่กว่ามือปรับวิธี
การแปล กรุณารอสักครู่..