REFERENCES
[1] Adelberg, B., NoDoSE: A tool for semiautomatically extracting
structured and semistructured data from text documents, In
Proceedings of ACM SIGMOD Conference on Management of Data,
1998, pp. 283-294.
[2] Ashish, N. and Knoblock, C. A., Semi-Automatic Wrapper
Generation for Internet Information Sources, In Proceedings of the
Conference on Cooperative Information Systems, 1997, pp. 160-169.
[3] Ashish, N. and Knoblock, C. A., Wrapper Generation for Semistructured
Internet Sources, SIGMOD Record, Vol. 26, No. 4, 1997,
pp. 8-15.
[4] Embley, D. W., Jiang, Y., and Ng, Y.-K., Record-boundary discovery
in Web documents, In Proceedings of the 1999 ACM SIGMOD
international conference on Management of data, Philadelphia PA,
1999, pp. 467-478.
[5] Valter Crescenzi, GiansalvatoreMecca. RoadRunner: Towards
Automatic Data Extraction from Large WebSite [A]. In proceeding of
the 26th International Conference on very Large Database Systems[C],
2001:109-118.
[6] Chakrabarti, S., Integrating the Document Object Model with
hyperlinks for enhanced topic distillation and information extraction,
In the 10th International World Wide Web Conference, 2001.
[7] Shian-Hua Lin, Jan-Ming Ho: Discovering informative content blocks
from Web documents,KDD 2002: 588-593.
[8] Suhit Gupta, Gail E. Kaiser, David Neistadt, Peter Grimm: DOMbased
content extraction of HTML documents. WWW 2003: 207-
214.
[9] Deng Cai, Shipeng Yu, Ji-Rong Wen, Wei-Ying Ma: Extracting
Content Structure for Web Pages Based on Visual Representation.
APWeb 2003: 406-417
[10] 李效东,顾毓清. 基于DOM 的Web 信息抽取[J] . 计算机学
报,2002 ,25 (5) :128
[11] 常育红,姜哲,朱小燕.基于标记树表示方法的页面结构分析[J].
计算机工程与应用,2004 (16):129~132
[12] 高军,王腾蛟,等. 基于Ontology 的Web 内容二阶段半自动提取
方法[J]. 计算机学报,2004,27(3):310-317
การอ้างอิง[1] Adelberg บี NoDoSE: เครื่องมือสำหรับการดึงข้อมูลไปยังบุคคลโครงสร้าง และข้อความข้อมูล semistructured ในเอกสารรายงานการประชุม SIGMOD พลอากาศจัดการข้อมูลปี 1998 นำ 283-294[2] N. และ Knoblock, C. A. กระดาษห่อกึ่งอัตโนมัติ โคลฟสร้างแหล่งข้อมูลอินเทอร์เน็ต ในวิชาการการประชุมวิชาการระบบสารสนเทศสหกรณ์ 1997 นำ 160-169[3] โคลฟ N. และ Knoblock, C. A. รุ่น Wrapper สำหรับ Semistructuredอินเทอร์เน็ตแหล่ง คอร์ด SIGMOD ปี 26 หมายเลข 4 ปี 1997นำ 8-15[4] Embley, D. ปริมาณ เจียง Y. และ Ng, Y.-คุณ คอร์ดขอบเขตค้นหาในเว็บเอกสาร ในวิชาการ SIGMOD พลอากาศ 1999การประชุมนานาชาติในการจัดการข้อมูล ฟิลาเดลเฟีย PAปี 1999 นำ 467 478[5] Valter Crescenzi, GiansalvatoreMecca โรดรันเนอร์: ต่อดึงข้อมูลอัตโนมัติจากเว็บไซต์ขนาดใหญ่ [A] ในการดำเนินการของการประชุมนานาชาติ 26 บนระบบที่ฐานข้อมูลมีขนาดใหญ่มาก [C],2001:109-118[6] Chakrabarti, S. รวมรุ่นวัตถุเอกสารด้วยเชื่อมโยงหลายมิติในหัวข้อเพิ่มข้อมูลและการกลั่นแยกในสากลเวิลด์ไวด์เว็บการประชุมวิชาการระดับ 2001[7] shian หัวหลิน Jan-หมิงโฮจิมินห์: ค้นพบบล็อกข้อมูลเนื้อหาจากเว็บเอกสาร KDD 2002:588-593[8] กุปตา Suhit นิคม E. Gail, David Neistadt ปีเตอร์ Grimm: DOMbasedแยกเนื้อหาของเอกสาร HTML WWW 2003:207-214[9] เต็งไก Ma หยิง Wei Shipeng Yu ร่องจีเหวิน : แยกโครงสร้างเนื้อหาในหน้าเว็บตามภาพAPWeb 2003:406-417[10] 李效东 顾毓清 基于DOM 的Web 信息抽取 [J] 计算机学报 2002, 25 (5): 128[11] 常育红,姜哲,朱小燕.基于标记树表示方法的页面结构分析[J]计算机工程与应用 2004 (16): 129 ~ 132[12] 高军 王腾蛟 等. 基于Ontology 的Web 内容二阶段半自动提取方法 [เจ] 计算机学报 2004, 27 (3): 310-317
การแปล กรุณารอสักครู่..
ข้อมูลอ้างอิง
[1] Adelberg บี NoDoSE: เครื่องมือสำหรับ semiautomatically สกัด
ข้อมูลที่มีโครงสร้างและแบบกึ่งโครงสร้างจากเอกสารข้อความใน
กิจการของ ACM SIGMOD การประชุมเกี่ยวกับการจัดการข้อมูล
.. 1998, pp 283-294
[2] Ashish เอ็น และ Knoblock, CA, กึ่งอัตโนมัติ Wrapper
รุ่นสำหรับแหล่งที่มาของข้อมูลทางอินเทอร์เน็ตในการดำเนินการของ
การประชุมเกี่ยวกับสหกรณ์ Information Systems, 1997, pp. 160-169.
[3] Ashish เอ็นและ Knoblock, CA, รุ่น Wrapper สำหรับแบบกึ่งโครงสร้าง
อินเทอร์เน็ต แหล่งที่มา SIGMOD บันทึกฉบับ 26 ฉบับที่ 4 ปี 1997
ได้ pp 8-15.
[4] Embley, DW เจียง, Y. และ Ng, Y. -เคค้นพบบันทึกเขตแดน
ในเอกสารของเว็บในการดำเนินการของปี 1999 ACM SIGMOD
การประชุมระหว่างประเทศเกี่ยวกับการบริหารจัดการของข้อมูล, ฟิลาเดลเฟีย,
1999, pp. 467-478.
[5] Valter Crescenzi, GiansalvatoreMecca RoadRunner: สู่
การสกัดข้อมูลอัตโนมัติจากเว็บไซต์ขนาดใหญ่ที่ [] ในการดำเนินการของ
การประชุมนานาชาติครั้งที่ 26 เกี่ยวกับระบบฐานข้อมูลขนาดใหญ่มาก [C],
2001:. 109-118
[6] จักรพรรดิ, S. , การบูรณาการเอกสารวัตถุแบบจำลองที่มี
การเชื่อมโยงสำหรับการกลั่นหัวข้อที่เพิ่มขึ้นและการสกัดข้อมูล
ในวันที่ 10 World International ไวด์เว็บประชุม 2001.
[7] Shian-Hua หลิน ม.ค. หมิงโฮ: การค้นพบบล็อกเนื้อหาข้อมูล
จากเอกสารเว็บ KDD 2002:. 588-593
[8] Suhit Gupta เกลอีไกเซอร์เดวิด Neistadt ปีเตอร์กริมม์ : DOMbased
สกัดเนื้อหาของเอกสาร HTML WWW 2003: 207-
214.
[9] เติ้ Cai, Shipeng ยูจีร่องไต Wei-Ma Ying: สกัด
. โครงสร้างเนื้อหาสำหรับหน้าเว็บจากภาพแทน
APWeb 2003: 406-417
[10]李效东,顾毓清 基于DOM的เว็บ信息抽取[J] 计算机学
报2002, 25 (5): 128
[11]
(16): 129 ~ 132
[12]高军,王腾蛟,等 基于อภิปรัชญา的เนื้อหาของเว็บประการที่สอง阶段半自动提取
方法[J] 计算机学报, 2004,27 (3): 310-317
การแปล กรุณารอสักครู่..
อ้างอิง
[ 1 ] adelberg บี nodose : เครื่องมือ semiautomatically แยก
โครงสร้างและสร้างข้อมูลจากเอกสารข้อความในรายงานการประชุมของการประชุม sigmod ACM
ในการจัดการข้อมูล 283-294 1998 , pp . .
[ 2 ] และชิช , เอ็น knoblock , C . A . กึ่งอัตโนมัติ Wrapper
รุ่น แหล่งข้อมูล อินเทอร์เน็ตในการดําเนินการของ
ว่าด้วยระบบ ข้อมูลสหกรณ์ 1997 , pp .160-169 .
[ 3 ] และชิช , เอ็น knoblock , C . A . ห่อรุ่นเพื่อสร้างแหล่ง sigmod
อินเทอร์เน็ต , บันทึก , ปีที่ 26 ฉบับที่ 4 , 1997 , pp . 8-15
.
[ 4 ] บลีย์ , D . W . , เจียง , Y และ ng Y - k . ในเอกสารบันทึกการค้นพบ
ขอบ เว็บ ในการดําเนินการของปี 1999 โดย sigmod
การประชุมระหว่างประเทศว่าด้วยการจัดการข้อมูล , Philadelphia PA
1999 , pp . 467-478 .
[ 5 ] crescenzi วอลเตอร์ ,giansalvatoremecca . โรดรันเนอร์ : ต่อ
การสกัดข้อมูลอัตโนมัติจากเว็บไซต์ [ ขนาดใหญ่ ] ในเอกสารประกอบการประชุมวิชาการนานาชาติ
26 ระบบฐานข้อมูลขนาดใหญ่มาก [ C ] ,
2001:109-118 .
[ 6 ] chakrabarti , เอส , รวมเอกสารวัตถุกับรูปแบบการเชื่อมโยงหลายมิติสำหรับการกลั่นและเพิ่มหัวข้อ
ข้อมูลการสกัดในโลกกว้างเว็บการประชุมระหว่างประเทศ 10
2001[ 7 ] เชียรหัวหลิน จางหมิงโฮ : การค้นพบข้อมูลเนื้อหาบล็อก
จากเอกสารเว็บ KDD 2002 : 588-593 .
[ 8 ] suhit Gupta , เกล เช่น ไคเซอร์ เดวิด neistadt ปีเตอร์ กริม : dombased
เนื้อหาการสกัดของเอกสาร HTML www 2003 : 207 -
214 .
[ 9 ] เติ้ง ไช่ shipeng ยูจีหยงเหวินเว่ยอิงมา : การสกัด
เนื้อหาโครงสร้างของหน้าเว็บขึ้นอยู่กับการแสดง .
apweb 2003 : 406-417 李效东
[ 10 ] ,顾毓清 . 基于ดอม的เว็บ信息抽取 [ J ] 计算机学
报 , 2002 , 25 ( 5 ) : 128
[ 11 ] 常育红姜哲朱小燕 , , . 基于标记树表示方法的页面结构分析 [ J ] .
计算机工程与应用 2004 ( 16 ) : 129 ~ 132
[ 12 ] 高军王腾蛟等 , , . 基于อภิปรัชญา的เว็บ内容二阶段半自动提取
方法 [ J ] 计算机学报 2004,27 310-317 , ( 3 ) :
การแปล กรุณารอสักครู่..