3.4. The quality of the static and the dynamic PPI networks
Considering that the interactions in the dynamic PPI networks
are simultaneously obtained under the same condition, we
consider that these interactions have higher quality than those in
the static PPI network. Pearson correlation coefficient (PCC) is
introduced to evaluate how strong two interacting proteins are
co-expressed (Li et al., 2012), and GO similarity is selected to
measure the functional similarity of interacting proteins. We
compare the average PCC and the average GO similarity of four PPI
networks which refer to the static network, our dynamic network,
and two dynamic PPI networks constructed by the methods
introduced by Tang et al. (2011) and Wang et al. (2013),
respectively. The four networks are obtained with the same
PPI data. The results are shown in Table 3. We can find that both
the average PCC and GO similarity of the three dynamic PPI
networks are higher than that of the static PPI network. But it is
regrettable that the increase in GO similarity is generally low no
matter which dynamic PPI network is compared with the static
network. Nevertheless, the average PCC of dynamic networks
constructed by our method and Wang’s method is much higher
than that of the static network, and our dynamic network can
achieve the highest PCC. Thus, we conclude that the quality of
dynamic PPI networks is higher than that of the static PPI
network, and the dynamic PPI network constructed by our
method is relatively good.
3.5. Effect of parameter a
Parameter a is a harmonic coefficient in integrating dynamic
local average connectivity and complex centrality. Table 4 shows
the effect of parameter a on the performance of CDLC algorithms,
where k is the number of top ranked proteins. CDLC can predict the
highest number of true essential proteins with a = 0.1.
This observation suggests that the complex component is an
excellent property for predicting essential proteins while the LAC
component only has a little effect. This finding can be attributed to
the fact that essentiality is a product of protein complexes rather
than the individual protein, and protein complexes have a high
collection of essential proteins (Hart et al., 2007). Nevertheless,
comparing the result of CDLC with a = 0 and that with a = 0.1, we
find that a better result can be achieved by the latter value of a.
In addition, the protein complexes of some species are less
completed than yeast. Therefore, deleting the LAC component may
significantly reduce prediction precision. Thus, the LAC component
is indispensable although it only has a little effect on the results for
yeast dataset.
3.6. Identifying essential proteins in dynamic PPI network only based
on topology
In the previous section, we hypothesized that identifying
essential proteins in the dynamic network can optimize the
performance of topology-based methods. To prove the validity of
this hypothesis, we take three topology-based methods (DC, SoECC
and LAC) as examples. These methods are selected because they
can be used to predict essential proteins from different angles. DC
bases on the number of neighbors of each current node, SoECC
focuses on the importance of the edges connected with current
node and LAC considers the significance of neighbors of current
node. We compare the performance of DC, SoECC and LAC based on
the static PPI network with that applied in the dynamic network.
When implementing the three methods in the dynamic PPI
network, for each protein, we first calculate the centrality scores
related to each of those temporal networks that contain the
protein. Then, we obtain the mean of these centrality scores and
regard it as the final centrality score of this protein. The final score
of a protein that is not included in any temporal network is set to 0.
The proteins that are not included in the dynamic PPI network and
the interactions related to those proteins are deleted from the
static PPI network to achieve a fair comparison. Regardless of
which method and which branch of the six types of top ranked
proteins is considered, more essential proteins are correctly
predicted from the dynamic network than from the original static
network and the remaining static network (Fig. 3). Therefore, we
can conclude that predicting essential proteins based on the
dynamic network topology can achieve better performance. In
addition, deleting the proteins excluded from the dynamic
network only has minimal effect on the performance of the three
methods. That is to say, it is the usage of dynamic PPI network that
results in the improvement of prediction precision rather than the
deletion of proteins.
3.7. Comparing CDLC with other algorithms
In this section, we evaluate the performance of CDLC (a = 0.1) by
comparing it with five previously proposed methods (DC, LAC,
SoECC, PeC, and CoEWC). We test these methods with the same PPI
data and gene expression data. Then, we delete from the static PPI
network the proteins excluded from the dynamic PPI network and
the interactions related to these proteins. The comparison results
are shown in Fig. 4. CDLC performs better than all the other
methods. Moreover, for the 600 top ranked proteins, we find that
the prediction precision can achieve more than 45% improvement
when CDLC is compared with DC.
Additionally, CDLC is also compared with the latest approach
CEPPK (Li et al., 2014) which predicts essential proteins based on a
fraction of known essential proteins. CEPPK provides us with a new
angle to effectively discover essential proteins and the results show
that CEPPK is an effective method. CEPPK selects a fraction of
known essential proteins as a “seed” to predict the essentiality of
other proteins. The number of “seed” essential proteins has only
little influence on the prediction precision of CEPPK. Therefore, we
only randomly select 50 and 100 known essential proteins for
20 times as samples to compare CDLC with CEPPK, respectively.
Here, prediction precision means the proportion of true essential
proteins out of a certain number of top ranked proteins
(Li et al., 2014). To achieve a fair comparison, these “seed”
essential proteins are excluded from the top ranked protein list
before calculating the prediction precision of CEPPK and CDLC. As
shown in Fig. 5, when 50 known essential proteins are selected to
be seeds, the prediction precision of CDLC is higher than that of
CEPPK no matter how many top ranked proteins are considered.
Similar results can be found when 100 known essential proteins
are selected to be seeds. In addition, the advantage of CDLC
becomes more apparent with the number of known essential
proteins increasing. So we can conclude that CDLC is more effective
than CEPPK.
3.8. The sensitivity analysis of parameters.
3.8. The sensitivity analysis of parameters.
In this section, the sensitivity of two parameters (the active
threshold and a in Function (6)) is test by jackknifing. The
interactions in the original static PPI network are randomly divided
into ten equal subsets. We leave out one subset and integrate the
other nine subsets to obtain a new static PPI network, and the
process is repeated ten times with each of the ten subsets being left
out exactly once. After that, ten new static PPI networks are
obtained. Then we start CDLC with each of the ten static PPI
networks to discuss the values of the two parameters by the same
method used in Section 3.2 and 3.5, respectively. The jackknifing
process is repeated five times. The results of the active threshold are
shown in Fig. 6 and Table 5. We can see that the results are similar to
those in Section 3.2. Therefore, it is reasonable to set the active
threshold to 0.8. As shown in Fig. 7, no matter which time of the five
jackknifing is considered, CDLC achieves the highest precision with
a set to 0.1, which accord with the results in Section 3.5. So we
conclude that both parameters in CDLC are stable.
3.4.คุณภาพคงที่และเครือข่าย PPI แบบไดนามิกพิจารณาที่การโต้ตอบในเครือข่าย PPI แบบไดนามิกจะได้รับภายใต้เงื่อนไขเดียวกัน พร้อมกันเราพิจารณาว่า โต้ตอบเหล่านี้มีคุณภาพสูงกว่าในเครือข่าย PPI คง Coefficient สหสัมพันธ์เพียร์สัน (PCC) เป็นนำมาใช้เพื่อประเมินความแข็งแกร่ง 2 โปรตีนที่โต้ตอบได้ร่วมแสดง (Li et al., 2012), และความคล้ายคลึงกันไปเลือกวัดความคล้ายคลึงกันทำงานของโปรตีนที่โต้ตอบ เราเปรียบเทียบคล้ายคลึงไปเฉลี่ยสี่ PPI และ PCC เฉลี่ยเครือข่ายซึ่งหมายถึงเครือข่ายคง เครือข่ายของเราแบบไดนามิกและสองเครือข่าย PPI ที่แบบไดนามิกสร้างขึ้น โดยวิธีการนำ โดย Tang et al. (2011) และ al. et วัง (2013),ตามลำดับ เครือข่าย 4 จะได้รับ ด้วยเหมือนกันข้อมูล PPI ผลลัพธ์จะแสดงอยู่ในตาราง 3 เราสามารถ find ที่ทั้งสองเฉลี่ย PCC และไปเฉพาะของ PPI ไดนามิกสามเครือข่ายเป็นระดับเครือข่าย PPI คง แต่มันเป็นเพิ่มไปมิใช่น้อยว่าโดยทั่วไปต่ำไม่พอเรื่องเครือข่าย PPI แบบไดนามิกที่ถูกเปรียบเทียบกับแบบคงเครือข่าย อย่างไรก็ตาม PCC เฉลี่ยของเครือข่ายแบบไดนามิกสร้าง โดยวิธีการของเรา และวิธีการของวังจะสูงกว่าที่เครือข่ายคง และเครือข่ายของเราแบบไดนามิกสามารถบรรลุ PCC สูงสุด ดังนั้น เราสรุปที่คุณภาพของเครือข่าย PPI แบบไดนามิกจะสูงกว่าของ PPI คงที่เครือข่าย และเครือข่าย PPI แบบไดนามิกที่สร้างขึ้นโดยของเราวิธีจะค่อนข้างดี3.5. ผลของพารามิเตอร์พารามิเตอร์เป็น coefficient มีค่าในการรวมไดนามิกเชื่อมต่อเฉลี่ยเฉพาะและซับซ้อนเอกภาพ ตารางที่ 4 แสดงผลของพารามิเตอร์การในประสิทธิภาพของอัลกอริทึม CDLCโดยที่ k คือ จำนวนของโปรตีนการจัดอันดับด้านบน CDLC สามารถทำนายการจำนวนสูงสุดของโปรตีนจำเป็นอย่างแท้จริงด้วยการ = 0.1สังเกตนี้แนะนำว่า เป็นส่วนประกอบที่ซับซ้อนการคุณสมบัติที่ยอดเยี่ยมสำหรับการคาดการณ์โปรตีนสำคัญขณะ LACส่วนมีผลเพียงเล็กน้อยเท่านั้น finding นี้สามารถเกิดจากessentiality ที่เป็นผลิตภัณฑ์ของโปรตีนคอมเพล็กซ์แต่ความจริงโปรตีนแต่ละ และโปรตีนคอมเพล็กซ์มีมากคอลเลกชันของโปรตีนสำคัญ (ฮาร์ท et al., 2007) อย่างไรก็ตามเปรียบเทียบผลของ CDLC กับ = 0 และที่มีการ = 0.1 เราfind ที่ให้ผลลัพธ์ดีกว่าสามารถทำได้ โดยค่าหลังการนอกจากนี้ คอมเพล็กซ์โปรตีนบางชนิดมีน้อยเสร็จสมบูรณ์กว่ายีสต์ ดังนั้น การลบคอมโพเนนต์ลัคอาจsignificantly ลดความแม่นยำในการทำนาย ดังนั้น ส่วนประกอบของ LACเป็นสำคัญแม้ว่าจะมีเพียงเล็กน้อยผลผลลัพธ์ในชุดข้อมูลของยีสต์3.6 การระบุโปรตีนสำคัญในเครือข่าย PPI แบบไดนามิกการในโทโพโลยีในส่วนก่อนหน้านี้ เราตั้งสมมติฐานว่าที่ระบุโปรตีนสำคัญในเครือข่ายแบบไดนามิกสามารถเพิ่มประสิทธิภาพการประสิทธิภาพของวิธีใช้โทโพโลยี เพื่อพิสูจน์การมีผลบังคับใช้สมมติฐานนี้ เราใช้สามโทโพโลยีตามวิธี (DC, SoECCและ LAC) เป็นตัวอย่าง เลือกวิธีการเหล่านี้เนื่องจากพวกเขาสามารถใช้ในการทำนายโปรตีนสำคัญจากมุมมองที่แตกต่างกัน DCฐานจำนวนบ้านของแต่ละโหนดปัจจุบัน SoECCเน้นความสำคัญของขอบที่เชื่อมโยงกับปัจจุบันโหนและ LAC พิจารณา significance ของเพื่อนบ้านของปัจจุบันโหน เราเปรียบเทียบประสิทธิภาพของ DC, SoECC และ LAC ตามเครือข่าย PPI คง มีที่ใช้ในเครือข่ายแบบไดนามิกเมื่อใช้วิธีการสามวิธีใน PPI แบบไดนามิกเครือข่าย สำหรับแต่ละโปรตีน เรา first คำนวณคะแนนเอกภาพที่เกี่ยวข้องกับแต่ละข่ายชั่วคราวที่ประกอบด้วยการโปรตีน จากนั้น เราได้รับค่าเฉลี่ยของคะแนนเหล่านี้เอกภาพ และพิจารณาเป็นคะแนนแห่ง final ของโปรตีนนี้ คะแนน finalโปรตีนที่ไม่มีอยู่ในเครือข่ายชั่วคราวถูกกำหนดเป็น 0โปรตีนที่ไม่ได้อยู่ในเครือข่าย PPI แบบไดนามิก และการโต้ตอบที่เกี่ยวข้องกับโปรตีนเหล่านั้นจะถูกลบออกจากการเครือข่าย PPI คงเพื่อให้เกิดการเปรียบเทียบที่เหมาะสม ไม่ว่าวิธีการและลำดับที่สาขาด้านบนหกชนิดพิจารณาโปรตีน โปรตีนที่จำเป็นมากขึ้นได้อย่างถูกต้องทำนายจากเครือข่ายแบบไดนามิกกว่าจากคงเดิมเครือข่ายและเครือข่ายคงเหลือ (Fig. 3) ดังนั้น เราสรุปว่า โปรตีนจำเป็นสำหรับการคาดการณ์ตามโทโพโลยีเครือข่ายแบบไดนามิกสามารถบรรลุประสิทธิภาพ ในเพิ่ม ลบโปรตีนที่แยกออกจากแบบไดนามิกเครือข่ายเท่านั้นมีผลน้อยกับประสิทธิภาพของทั้งสามวิธี กล่าวคือ มันเป็นการใช้ PPI แบบเครือข่ายที่ผลในการปรับปรุงความแม่นยำในการคาดเดาดีกว่าการลบของโปรตีน3.7 การเปรียบเทียบ CDLC กับอัลกอริทึมอื่น ๆในส่วนนี้ เราได้ประเมินประสิทธิภาพของ CDLC (เป็น = 0.1) โดยเปรียบเทียบได้กับ five ก่อนหน้านี้นำเสนอวิธีการ (DC, LACSoECC, PeC และ CoEWC) ทดสอบวิธีการเหล่านี้กับ PPI เหมือนกันข้อมูลและข้อมูลนิพจน์ยีน จากนั้น เราลบจาก PPI คงโปรตีนที่แยกออกจากเครือข่าย PPI แบบเครือข่าย และการโต้ตอบที่เกี่ยวข้องกับโปรตีนเหล่านี้ ผลการเปรียบเทียบมีแสดงใน Fig. 4 CDLC ทำดีกว่าทั้งหมดอื่น ๆวิธี นอกจากนี้ สำหรับโปรตีน การจัดอันดับด้านบน 600 เรา find ที่ความแม่นยำในการพยากรณ์สามารถบรรลุมากกว่า 45% ปรับปรุงเมื่อ CDLC เปรียบเทียบกับ DC นอกจากนี้ CDLC ยังเปรียบเทียบกับวิธีล่าสุดCEPPK (Li et al., 2014) ซึ่งทำนายโปรตีนที่จำเป็นตามเศษของโปรตีนสำคัญที่รู้จักกัน CEPPK ให้เราใหม่มุมได้อย่างมีประสิทธิภาพโปรตีนที่สำคัญและผลลัพธ์แสดงCEPPK นั้นเป็นวิธีมีประสิทธิภาพ CEPPK เลือกเศษส่วนของโปรตีนจำเป็นรู้จักเป็น "เมล็ด" เพื่อทำนาย essentiality ของโปรตีนอื่น ๆ มีจำนวนโปรตีนสำคัญ "เมล็ด" เท่านั้นinfluence น้อยความคาดเดาของ CEPPK ดังนั้น เราสุ่มเลือก 50 และ 100 รู้จักจำเป็นโปรตีนสำหรับครั้งที่ 20 เป็นตัวอย่างการเปรียบเทียบ CDLC กับ CEPPK ตามลำดับที่นี่ ความแม่นยำในการทำนายหมายถึง สัดส่วนของจำเป็นจริงโปรตีนจากจำนวนโปรตีนอันดับสูงสุด(Li et al., 2014) เพื่อเปรียบเทียบธรรม เหล่านี้ "เมล็ด"โปรตีนจำเป็นจะไม่รวมรายการโปรตีนอันดับสูงสุดก่อนที่จะคำนวณความแม่นยำในการทำนายของ CEPPK และ CDLC เป็นแสดงใน Fig. 5, 50 โปรตีนจำเป็นรู้จักการให้เป็นเมล็ดพืช ความแม่นยำในการทำนายของ CDLC จะสูงกว่าที่CEPPK ว่าพิจารณาด้านจำนวนลำดับโปรตีนผลคล้ายกันสามารถพบเมื่อ 100 โปรตีนสำคัญรู้จักมีเลือกให้ เมล็ด นอกจากนี้ ข้อดีของ CDLCจะเห็นได้ชัดเจนมากขึ้น มีจำนวนเป็นที่รู้จักโปรตีนที่เพิ่มขึ้น ดังนั้น เราสามารถสรุปว่า CDLC มีประสิทธิภาพมากขึ้นกว่า CEPPK3.8. การวิเคราะห์ความไวของพารามิเตอร์3.8. การวิเคราะห์ความไวของพารามิเตอร์ในส่วนนี้ ความไวของพารามิเตอร์ที่สอง (ใช้งานอยู่ขีดจำกัดและฟังก์ชันใน (6)) ทดสอบ โดย jackknifing ที่โต้ตอบในเครือข่าย PPI คงเดิมมีแบ่งแบบสุ่มในสิบชุดย่อยเท่านั้น เราปล่อยออกมาย่อยหนึ่ง และรวมการย่อยอื่น ๆ เก้ารับใหม่คง PPI เครือข่าย และกระบวนการซ้ำ 10 ครั้งแต่ละชุดย่อย 10 ที่ถูกทิ้งออกตรงกัน หลังจากนั้น เป็นสิบคง PPI เครือข่ายใหม่ได้รับการ แล้ว เราเริ่ม CDLC ด้วย PPI คงสิบเครือข่ายเพื่อหารือเกี่ยวกับค่าของพารามิเตอร์สอง ด้วยเหมือนกันวิธีใช้ในหัวข้อ 3.2 และ 3.5 ตามลำดับ Jackknifingกระบวนการเป็นเวลา five ซ้ำ ผลของขีดจำกัดการใช้งานแสดงในตาราง 5 และ Fig. 6 เราสามารถดูว่า ผลลัพธ์จะเหมือนกับคนในหัวข้อ 3.2 ดังนั้น จึงเหมาะสมที่จะตั้งค่าการใช้งานขีดจำกัดการ 0.8 ตามที่แสดงใน Fig. 7 ไม่ว่าเวลาใด fiveถือว่าเป็น jackknifing, CDLC ประสบความแม่นยำสูงสุดด้วยตั้งค่าเป็น 0.1 ซึ่งแอคคอร์ดกับผลลัพธ์ในส่วน 3.5 ดังนั้นเราสรุปว่า ทั้งสองพารามิเตอร์ใน CDLC จะมีเสถียรภาพ
การแปล กรุณารอสักครู่..
3.4 . คุณภาพของแบบคงที่และแบบไดนามิกเครือข่าย PPI
พิจารณาว่า การสื่อสารในเครือข่ายแบบไดนามิกจะพร้อมกัน
PPI ได้ภายใต้เงื่อนไขเดียวกันเรา
พิจารณาการโต้ตอบเหล่านี้มีคุณภาพสูงกว่า
เครือข่าย ppi แบบคงที่ หาค่าสัมประสิทธิ์สหสัมพันธ์แบบเพียร์สัน coef จึง cient ( PCC )
แนะนำให้ประเมินว่าสองแรงโต้ตอบโปรตีน
Co แสดง ( Li et al . ,2012 ) และไปเลือก
วัดความเหมือนความเหมือนแบบโต้ตอบโปรตีน เรา
เปรียบเทียบ PCC เฉลี่ยเฉลี่ยไปกันสี่ PPI
เครือข่ายซึ่งหมายถึงเครือข่ายคงที่ , เครือข่ายแบบไดนามิก ,
2 แบบไดนามิก PPI เครือข่ายสร้างโดยวิธี
แนะนำโดย Tang et al . ( 2011 ) และ Wang et al . ( 2013 )
)4 เครือข่ายที่ได้รับกับข้อมูล PPI เดียวกัน
ผลลัพธ์จะแสดงในตารางที่ 3 เราสามารถถ่ายทอดงานที่ทั้ง
PCC เฉลี่ยและความเหมือนของแบบไดนามิก PPI
3 เครือข่ายจะสูงกว่าที่ของเครือข่าย หรือ คงที่ แต่ก็น่าเสียดาย ที่เพิ่มไป
เรื่องความเหมือนโดยทั่วไปจะต่ำไม่ซึ่งเครือข่าย PPI แบบไดนามิกเมื่อเทียบกับเครือข่ายคงที่
อย่างไรก็ตามการสร้างเครือข่ายแบบไดนามิกหรือเฉลี่ย
จากวิธีการและหวัง วิธีของเราคือที่สูงขึ้นมาก
กว่าของเครือข่ายแบบคงที่และแบบไดนามิก , เครือข่ายของเราสามารถ
บรรลุ PCC สูงสุด ดังนั้นเราจึงสรุปได้ว่าคุณภาพของเครือข่ายแบบไดนามิก
PPI สูงกว่าของเครือข่าย PPI
คงที่และแบบไดนามิกซึ่งเครือข่ายสร้างโดยวิธีของเราค่อนข้างดี
.
3 . ผลของพารามิเตอร์
พารามิเตอร์เป็นจึง coef ฮาร์ cient ในการบูรณาการแบบไดนามิก
การเชื่อมต่อท้องถิ่นเฉลี่ยและศูนย์กลางที่ซับซ้อน ตารางที่ 4 แสดงผลของพารามิเตอร์ต่อ
cdlc ประสิทธิภาพของขั้นตอนวิธี , โดยที่ k คือจำนวนอันดับสุดยอดโปรตีน cdlc สามารถทำนายจำนวนสูงสุดของทรู ที่สำคัญโปรตีนด้วย
= 0.1 ) นี้แสดงให้เห็นว่าองค์ประกอบที่ซับซ้อนเป็น
คุณสมบัติที่ยอดเยี่ยมในโปรตีนจำเป็นในขณะที่ครั่ง
ส่วนประกอบ มีเพียงผลกระทบเล็กน้อย นี้จึงหาอาจจะเกิดจาก
ที่ว่า essentiality เป็นผลิตภัณฑ์โปรตีนเชิงซ้อนค่อนข้าง
กว่าโปรตีนแต่ละบุคคลและ complexes โปรตีนมีคอลเลกชันสูง
โปรตีนจำเป็น ( ฮาร์ท et al . , 2007 ) อย่างไรก็ตาม เมื่อเปรียบเทียบผลของ cdlc
ด้วย = 0 และนั่นด้วย = 0.1 ,เราจึงเป็นผลดีกว่า
และที่สามารถทำได้โดยค่าหลังของ A .
นอกจากนี้ โปรตีนเชิงซ้อนบางชนิดมีน้อย
เสร็จมากกว่ายีสต์ ดังนั้น การลบครั่งประกอบอาจ
signi จึงลดความแม่นลดลงอย่างมีนัยสําคัญเมื่อพยากรณ์ ดังนั้น ครั่งส่วนประกอบ
ขาดไม่ได้ถึงแม้ว่ามันจะมีเพียงผลกระทบเล็กน้อยในผล
ข้อมูลยีสต์ 3.6ระบุโปรตีนสำคัญในเครือข่ายแบบไดนามิกตามในแบบ PPI เท่านั้น
ในส่วนก่อนหน้าเราตั้งสมมติฐานว่า การระบุโปรตีนสำคัญในเครือข่ายแบบไดนามิก
สามารถเพิ่มประสิทธิภาพการปฏิบัติงานของเครือข่ายแบบที่ใช้วิธี เพื่อพิสูจน์ความถูกต้องของ
สมมติฐานนี้เราใช้เวลาสามแบบตามวิธี ( DC soecc
และครั่ง ) เป็นตัวอย่าง วิธีการเหล่านี้จะถูกเลือกเพราะพวกเขา
สามารถใช้ทำนายที่สำคัญโปรตีนจากมุมที่แตกต่างกัน DC
ฐานบนหมายเลขของประเทศเพื่อนบ้านในปัจจุบันแต่ละโหนด soecc
เน้นความสำคัญของขอบที่เชื่อมต่อกับปม
และครั่งจะพิจารณา signi ถ่ายทอดมะเร็งของประเทศเพื่อนบ้านของโหนดปัจจุบัน
เปรียบเทียบประสิทธิภาพของ DC , soecc และครั่งยึด
PPI เครือข่ายคงที่กับที่ใช้ในเครือข่ายแบบไดนามิก
เมื่อใช้ทั้งสามวิธีในเครือข่าย PPI
แบบไดนามิกสำหรับโปรตีนแต่ละ เราจึงตัดสินใจเดินทางไปคำนวณความสำคัญคะแนน
ที่เกี่ยวข้องกับแต่ละคน และเครือข่ายที่ประกอบด้วย
โปรตีน จากนั้นเราได้รับค่าเฉลี่ยของคะแนนความสำคัญเหล่านี้และ
ถือเป็นศูนย์กลางจึงนาลคะแนนของโปรตีนนี้ นาลจึงคะแนน
ของโปรตีนที่ไม่รวมอยู่ในเครือข่ายใด ๆและเป็นชุด
0โปรตีนที่ไม่ได้รวมอยู่ในเครือข่าย ppi แบบไดนามิกและปฏิสัมพันธ์ที่เกี่ยวข้องกับโปรตีนเหล่านั้น
จะถูกลบออกจากเครือข่าย PPI คงที่เพื่อให้บรรลุการเปรียบเทียบที่เป็นธรรม ไม่ว่าวิธีไหน
ซึ่งสาขาของหกชนิดของอันดับยอด
โปรตีนเป็นโปรตีนที่จำเป็นมากขึ้นอย่างถูกต้อง
ทำนายจากเครือข่ายแบบไดนามิกมากกว่าจาก
คงที่เดิมเครือข่ายและเครือข่ายที่เหลือคงที่ ( รูปที่ 3 ) ดังนั้นเราจึงสามารถสรุปได้ว่า โปรตีนที่จำเป็น
ทำนายตามโครงสร้างเครือข่ายแบบไดนามิกสามารถบรรลุประสิทธิภาพที่ดีขึ้น ใน
นอกจากนี้การลบโปรตีนแยกออกจากเครือข่ายแบบไดนามิก
มีเพียงผลกระทบน้อยที่สุดในประสิทธิภาพของ 3
วิธี จะบอกว่า มันคือการใช้เครือข่ายแบบไดนามิก PPI ที่
ผลในการปรับปรุงความแม่นยำการทำนายมากกว่า
การลบโปรตีน .
3.7 เปรียบเทียบ cdlc ด้วย
อัลกอริทึมอื่น ๆ ในส่วนนี้เราประเมินประสิทธิภาพของ cdlc ( =
= ) โดยเปรียบเทียบกับก่อนหน้านี้ จึงได้เสนอวิธีการ ( DC , ครั่ง
soecc เป็ค , และ coewc ) เราได้ทดสอบวิธีการเหล่านี้กับข้อมูลเดียวกันและ PPI
ข้อมูลการแสดงออกของยีน . งั้นเราลบจาก
PPI ไฟฟ้าสถิตเครือข่ายโปรตีนแยกออกจากเครือข่าย ppi แบบไดนามิกและ
ปฏิสัมพันธ์ที่เกี่ยวข้องกับโปรตีนเหล่านี้ ผลลัพธ์ที่แสดงในรูปที่ 4 เปรียบเทียบ
. cdlc มีประสิทธิภาพดีกว่าทุกคนอื่น
วิธี นอกจากนี้ สำหรับ 600 อันดับสุดยอดโปรตีน เราจึง ND ที่
ทำนายแม่นยำสามารถบรรลุการพัฒนามากกว่า 45 % เมื่อเทียบกับ cdlc DC .
นอกจากนี้cdlc ยังเทียบกับ ceppk เข้าหา
ล่าสุด ( Li et al . , 2010 ) ซึ่งคาดการณ์จำเป็นโปรตีน ตามสัดส่วนของโปรตีนที่สำคัญที่รู้จักกัน
. ceppk ให้มุมภาพค้นพบโปรตีนที่จำเป็นใหม่
และแสดงผลที่ ceppk เป็นวิธีการที่มีประสิทธิภาพ ceppk เลือกส่วนของโปรตีนที่จำเป็น
รู้จักเป็น " เมล็ดพันธุ์ " ทำนาย essentiality ของ
โปรตีนอื่น ๆ จำนวน " เมล็ดพันธุ์ " โปรตีนที่จำเป็นมีเพียงเล็ก ๆน้อย ๆในfl
uence ในการทำนายความแม่นยําของ ceppk . ดังนั้นเราจึง
แค่สุ่มเลือก 50 และ 100 รู้จักโปรตีนที่สําคัญสําหรับ
20 เท่า cdlc ตัวอย่างเปรียบเทียบกับ ceppk ตามลำดับ
ที่นี่ความแม่นยำการทำนายหมายถึงสัดส่วนของจริงจำเป็น
โปรตีนจํานวนด้านบนการจัดอันดับโปรตีน
( Li et al . , 2010 )เพื่อให้บรรลุการเปรียบเทียบที่เป็นธรรม เหล่านี้ " เมล็ดพันธุ์ "
จำเป็นโปรตีนแยกออกจากด้านบนการจัดอันดับโปรตีนรายชื่อ
ก่อนคำนวณความแม่นยำของการทำนายและ ceppk cdlc . ตามที่แสดงในรูปที่ 5
, โปรตีนที่จำเป็นเมื่อ 50 รู้จัก
เป็นเมล็ด ทำนายแม่นยำของ cdlc สูงกว่าของ
ceppk ไม่ว่ากี่อันดับโปรตีน
ถือว่าผลที่คล้ายกันสามารถพบได้เมื่อ 100 จักจำเป็นโปรตีน
ถูกเลือกเป็นเมล็ด นอกจากนี้ ประโยชน์ของ cdlc
กลายเป็นชัดเจนมากขึ้นกับจำนวนจักจำเป็น
โปรตีนเพิ่มขึ้น ดังนั้นเราสามารถสรุปได้ว่า cdlc มีประสิทธิภาพมากขึ้นกว่า ceppk
.
3.8 . การวิเคราะห์พารามิเตอร์
3.8 . การวิเคราะห์พารามิเตอร์ .
ในส่วนนี้ความไวของสองพารามิเตอร์ ( เกณฑ์งาน
และในฟังก์ชัน ( 6 ) ทดสอบโดย jackkni จึง ng
ปฏิสัมพันธ์ในต้นฉบับเครือข่าย PPI คงที่จะถูกสุ่มแบ่งออกเป็นส่วนย่อย
10 เท่ากัน เราออกจากหนึ่งย่อยและรวม
อีกเก้าจากที่จะได้รับเครือข่าย PPI สถิตใหม่และกระบวนการทำซ้ำ 10 ครั้ง
แต่ละสิบจากเป็นซ้าย
ออกเดียวหลังจากนั้น สิบสถิต PPI )
) งั้นเราเริ่ม cdlc แต่ละสิบสถิต PPI
เครือข่ายเพื่อหารือเกี่ยวกับค่าของทั้งสองพารามิเตอร์โดยเดียวกัน
วิธี ที่ใช้มาตรา 3.2 และ 3.4 ตามลำดับ กระบวนการถ่ายทอด jackkni ng
ซ้ำจึงได้ครั้ง ผลของงานจะแสดงในรูปตาราง
6 และ 5 เราสามารถเห็นผลลัพธ์ที่คล้ายกับ
ในส่วนที่ 2 . ดังนั้นจึงเหมาะสมที่จะตั้งเกณฑ์งาน
0.8 . ดังแสดงในรูปที่ 7 ไม่ว่าเวลาใดของจึงได้
jackkni จึงหลุด ก็ถือว่า cdlc บรรลุความแม่นยำสูงสุดกับ
ชุด 0.1 ซึ่งสอดคล้องกับผลการวิจัยในส่วน 3.5 . ดังนั้นเราจึงสรุปได้ว่าทั้งใน cdlc ค่า
เป็นมั่นคง
การแปล กรุณารอสักครู่..