XML Schema Mappings: Data Exchange and Metadata Management 12:7
(2-EXPTIME lower bound), and Theorem 7.6 (inequality, descendant, and horizontal
order).
Organization. Notations are given in Section 2. The schema mapping language is
described in Section 3. In Section 4, we study the membership problem. Complexity
of query answering is studied in Section 5. Static analysis problems are studied in
Section 6. Composition related problems are studied in Section 7. Concluding remarks
are given in Section 8.
2. PRELIMINARIES
2.1. XML Documents and DTDs
We view XML documents over a labeling alphabet of element types and a set of
attributes Att as structures T = (dom(T), ↓,→, lab, (ρa)a∈Att) where
—dom(T) is an unranked tree domain (a finite prefix-closed subset of N
∗ such that for
all n ∈ N, n · i ∈ dom(T) implies n · j ∈ dom(T) for all j < i);
—the binary relations ↓ and → are child (n ↓ n · i) and next sibling (n · i → n · (i + 1));
—lab : dom(T) → is the labeling function; and
—each ρa is a partial function from dom(T) to V, the domain of attribute values, that
gives the values of a for all the nodes in dom(T) where it is defined.
By |T|, we shall denote |dom(T)|, that is, the number of elements (nodes) of the underlying
tree domain dom(T).
A DTD D over with a distinguished symbol r (for the root) and a set of attributes
Att consists of a mapping PD from to regular expressions over − {r} (one typically
writes them as productions → e if PD() = e), and a mapping AD : → 2Att that
assigns a (possibly empty) set of attributes to each element type. We always assume,
for notational convenience, that attributes come in some order, just like in the relational
case: attributes in tuples come in some order so we can write R(a1, . . . , an). Likewise,
we shall describe an -labeled tree node with n attributes as (a1, . . . , an). Note that
arbitrary number of attributes can be modeled by trees with one attribute per node, by
using multiple children. Thus, the number of attributes will not play any special role
in our complexity results.
A tree T conforms to a DTD D (written as T |= D) if its root is labeled r, the set of
attributes for a node labeled is AD(), and the labels of the children of such a node,
read left-to-right, form a string in the language of PD().
We write D for the total size of D, or, in other words, the memory needed to store
a natural representation of D. We shall extend this notation to other complex objects
(sets of patterns, schema mappings, automata, etc.) as needed.
2.2. Relational Schema Mappings
We review the standard definitions of relational schema mappings, see Bernstein
and Melnik [2007], Fagin et al. [2005], and Kolaitis [2005]. Given two disjoint relational
schemas S (source) and T (target), a source-to-target dependency is an expression
of the form ϕs( ¯x, ¯y)−→ψt( ¯x, ¯z), where ϕs is a conjunction of atoms over
S and ψt is a conjunction of atoms over T. If we have a source schema instance
S and a target schema instance T, we say that they satisfy this dependency if
(S, T) |= ∀ ¯x∀ ¯y (ϕs( ¯x, ¯y)−→∃¯z ψt( ¯x, ¯z)). That is, we assume that new variables on the
right are quantified existentially, and the others are quantified universally. We also
omit quantifiers from our shorthand notation. Intuitively, new variables ¯z correspond
to new values put in the target: every time ϕs( ¯x, ¯y) is satisfied, new tuples are put in
the target to satisfy ψt( ¯x, ¯z) for some ¯z.
Journal of the ACM, Vol. 61, No. 2, Article 12, Publication date: April 2014.
แมป XML Schema: แลกเปลี่ยนข้อมูลและจัดการข้อมูลเมตา 12:7(2-EXPTIME ขอบต่ำสุด), และทฤษฎีบท 7.6 (อสมการ ใต้ และแนวนอนสั่ง)องค์กร ฯลฯ จะได้รับใน 2 ส่วน เป็นภาษาแบบแผนการแมปอธิบายไว้ในส่วนที่ 3 ใน 4 ส่วน เราศึกษาปัญหาสมาชิก ความซับซ้อนแบบสอบถาม ตอบศึกษา 5 ส่วน ปัญหาคงวิเคราะห์ได้ศึกษาในส่วน 6 องค์ประกอบที่เกี่ยวข้องกับปัญหาที่ศึกษาใน 7 ส่วน หมายเหตุสรุปจะได้รับในส่วน 82. PRELIMINARIES2.1 เอกสาร XML และ DTDsเราดูเอกสาร XML ผ่านอักษรติดฉลากชนิดองค์ประกอบและชุดคุณลักษณะ Att เป็นโครงสร้างที่ T = (dom(T) ↓ → แล็บ a∈Att (ρa)) ที่—dom(T) เป็นโดเมนทรี unranked (จำกัดปิดนำหน้าย่อยของ N∗กล่าวว่าสำหรับทั้งหมด n ∈ N, n · ผมหมายถึงการ∈ dom(T) n · j dom(T) ∈สำหรับเจทั้งหมด < ฉัน);— ↓ความสัมพันธ์ไบนารีและ→มีเด็ก (n ↓ n ·ฉัน) และพี่น้องถัดไป (n ·ฉัน→ n · (ผม + 1));-ห้องปฏิบัติการ: dom(T) →เป็นฟังก์ชันการติดฉลาก และตัวละ ρa เป็นฟังก์ชันบางส่วนจาก dom(T) ไป V โดเมนของแอททริบิวต์ค่า ที่ทำให้ค่าของการสำหรับโหนทั้งหมดใน dom(T) ที่กำหนดโดย |T| เราจะแสดง |dom (T) |, คือ หมายเลขขององค์ประกอบ (โหน) ของตัวแผนภูมิโดเมน dom(T)D DTD ผ่าน r สัญลักษณ์ที่แตกต่าง (สำหรับราก) และชุดของแอททริบิวต์Att ประกอบด้วย PD แมปจากการนิพจน์ทั่วไปมากกว่า− {r } (หนึ่งโดยทั่วไปเขียนเป็น e →การผลิตได้ถ้า PD () = e), และการแม็ป AD: → 2Att ที่กำหนดชุด (อาจว่าง) ของแอตทริบิวต์องค์ประกอบแต่ละประเภท เรามักจะสมมติมา notational ที่แอตทริบิวต์ในบาง เหมือนในแบบเชิงสัมพันธ์กรณี: แอตทริบิวต์ใน tuples มาสั่งบางอย่างเพื่อให้เราสามารถเขียน R (a1,..., การ) ในทำนองเดียวกันเราจะอธิบายโหนดแผนภูมิป้าย มีแอททริบิวต์ n เป็น (a1,..., การ) หมายเหตุว่ากำหนดหมายเลขของแอตทริบิวต์สามารถจำลอง โดยต้นไม้กับแอททริบิวต์หนึ่งต่อโหน โดยใช้เด็กหลาย ๆ จึง หมายเลขของแอตทริบิวต์จะไม่มีบทบาทใด ๆ พิเศษในผลลัพธ์ของความซับซ้อนตามต้นไม้ T DTD D (เขียนเป็น T | = D) ถ้ารากมันจะติดป้าย r ชุดแอตทริบิวต์สำหรับโหนป้ายเป็น(AD) และป้ายชื่อของเด็กเช่นโหนอ่านจากซ้ายไปขวา แบบสายอักขระภาษา(PD)เราเขียน D ขนาดของ D หรือ ในคำอื่น ๆ หน่วยความจำที่ต้องเก็บแสดงเป็นธรรมชาติดี เราจะขยายสัญกรณ์นี้วัตถุที่ซับซ้อนอื่น ๆ(ชุดรูปแบบ แบบแผนการแมป โกเบ ฯลฯ) ตามต้องการ2.2 แม็ปแผนสัมพันธ์กันเราตรวจสอบข้อกำหนดมาตรฐานของการแม็ปเค้าร่างเชิง ดูนาร์ดเบิร์นสไตน์Melnik [2007], Fagin และ al. [2005], และ Kolaitis [2005] ด้วย ให้สอง disjoint เชิงแผน S (ต้นทาง) และ T (เป้าหมาย), การอ้างอิงแหล่งเป้าหมายคือ นิพจน์ของแบบฟอร์ม ϕs (¯x, ¯y) −→ψt (¯x, ¯z), ϕs ร่วมของอะตอมมากกว่าS และ ψt เป็นร่วมของอะตอมเหนือต. ถ้าเรามีอินสแตนซ์ที่แบบแผนแหล่งS และอินสแตนซ์ของแผนเป้าหมาย T เราบอกว่า พวกเขาตอบสนองซึ่งถ้า(S, T) | =∀ ¯x∀ ¯y (ϕs (¯x, ¯y) −→∃¯z ψt (¯x, ¯z)) นั่นคือ การที่เราสมมุติว่าตัวแปรใหม่ในการขวาจะ quantified existentially และคนอื่น ๆ จะ quantified เกลียดชัง เรายังละบอกจากบันทึกย่อของเรา สังหรณ์ใจ ¯z ตัวแปรใหม่ตรงค่าใหม่ใส่เป้าหมาย: ทุกครั้งที่ความพึงพอใจ ϕs (¯x, ¯y) tuples ใหม่ถูกใส่ในเป้าหมายเพื่อตอบสนองให้กับ ψt (¯x, ¯z) ¯z บางสมุดรายวันของพลอากาศ 61 ปี หมายเลข 2 บทความ 12 วันเผยแพร่: 2014 เมษายน
การแปล กรุณารอสักครู่..
XML Schema แมป: การแลกเปลี่ยนข้อมูลและการบริหารจัดการ Metadata 12: 7
(2-EXPTIME ขอบเขตล่าง) และทฤษฎีบท 7.6 (ความไม่เท่าเทียมกันผู้สืบสันดานและแนวนอน
ตามลำดับ).
องค์การ ข้อความที่จะได้รับในส่วนที่ 2. การทำแผนที่ภาษาสคีถูก
อธิบายไว้ในมาตรา 3 ในมาตรา 4 เราศึกษาปัญหาการเป็นสมาชิก ความซับซ้อน
ของการตอบแบบสอบถามที่มีการศึกษาในมาตรา 5 การวิเคราะห์ปัญหาคงมีการศึกษาใน
มาตรา 6 ปัญหาที่เกี่ยวข้องกับองค์ประกอบที่มีการศึกษาในมาตรา 7 หมายเหตุสรุป
จะได้รับในมาตรา 8.
2 รอบคัดเลือกโซน
2.1 เอกสาร XML และ DTDs
เราดูเอกสาร XML กว่าการติดฉลากตัวอักษร? ประเภทองค์ประกอบและชุดของ
คุณลักษณะอัฐเป็นโครงสร้าง T = (Dom (T), ↓, →, ห้องปฏิบัติการ (ρa) a∈Att) ที่
-dom (T) เป็นโดเมนต้นไม้ unranked (ย่อยคำนำหน้าปิดแน่นอน ไนโตรเจน
* ดังกล่าวว่าสำหรับ
ทุก n ∈ N, N ·ฉัน∈ Dom (T) หมายถึง n · J ∈ Dom (T) สำหรับทุก J <i);
-The ฐานความสัมพันธ์และ↓→เป็นลูก (n ↓ n ·ฉัน ) และพี่น้องถัดไป (n ·ฉัน→ n · (i + 1));
-lab: Dom (T) →? เป็นฟังก์ชั่นการติดฉลาก; และ
-each ρaเป็นฟังก์ชั่นบางส่วนจาก Dom (T) เพื่อ V โดเมนของค่าแอตทริบิวต์ที่
ให้ค่าสำหรับโหนดทั้งหมดใน Dom (T) ซึ่งจะมีการกำหนดไว้.
ตาม | T | เราจะแสดงว่า | Dom (T) |, ที่อยู่, จำนวนขององค์ประกอบ (โหนด) ของพื้นฐาน
Dom โดเมนต้นไม้ (T).
DTD D มากกว่า? มีสัญลักษณ์ที่โดดเด่น R (สำหรับราก) และชุดของคุณลักษณะ
อัฐประกอบด้วย PD การทำแผนที่จาก? เพื่อการแสดงผลปกติมากกว่า? - {r} (หนึ่งมักจะ
เขียนพวกเขาเป็นโปรดักชั่น→อีถ้า PD () = e??) และการทำแผนที่ AD: → 2Att ที่
กำหนด (ที่ว่างเปล่าอาจจะ) ชุดของคุณลักษณะในแต่ละชนิดของ เรามักจะถือว่า
เพื่อความสะดวกสัญลักษณ์ว่าคุณลักษณะที่มาในการสั่งซื้อสินค้าบางอย่างเช่นเดียวกับในเชิง
กรณีแอตทริบิวต์ใน tuples มาในการสั่งซื้อสินค้าบางอย่างเพื่อให้เราสามารถเขียน R (... a1,) ในทำนองเดียวกัน
เราจะอธิบาย? -labeled โหนดต้นไม้ที่มีคุณลักษณะเป็น n? (A1,...) โปรดสังเกตว่า
จำนวนข้อของคุณลักษณะที่สามารถจำลองด้วยต้นไม้ด้วยแอตทริบิวต์ต่อโหนดโดย
ใช้เด็กหลาย ดังนั้นจำนวนของคุณลักษณะจะไม่เล่นบทบาทพิเศษใด ๆ
ในผลความซับซ้อนของเรา.
ต้นไม้ T สอดคล้องกับ DTD D (เขียนเป็น T | = D) ถ้ารากของมันจะมีป้าย R, ชุดของ
คุณลักษณะสำหรับโหนดที่ระบุว่า? เป็นโฆษณา (?), และป้ายชื่อของลูกหลานเช่นโหนด,
อ่านจากซ้ายไปขวารูปแบบสตริงในภาษาของ PD (?).
เราเขียนดีสำหรับขนาดรวมของ D หรือในที่อื่น ๆ คำหน่วยความจำที่จำเป็นในการจัดเก็บ
การแสดงธรรมชาติของดีเราจะขยายสัญกรณ์นี้เพื่อวัตถุอื่น ๆ ที่ซับซ้อน
(ชุดของรูปแบบ, การแมปคีออโต ฯลฯ ) ตามความจำเป็น.
2.2 Schema สัมพันธ์แมป
เราทบทวนคำนิยามมาตรฐานของแมปสคีสัมพันธ์เห็น Bernstein
และ Melnik [2007], Fagin และคณะ [2005] และ Kolaitis [2005] รับสองสัมพันธ์เคล็ด
schemas S (ต้นฉบับ) และ T (เป้าหมาย) แหล่งที่มาเพื่อเป้าหมายการพึ่งพาคือการแสดงออก
ในรูปแบบφs (x, y) - →ψt (x, Z) ซึ่งเป็นφs ร่วมของอะตอมมากกว่า
S และψtเป็นร่วมของอะตอมมากกว่า T. ถ้าเรามีสคีแหล่งที่มาเช่น
S และคีเป้าหมายเช่น T, เราบอกว่าพวกเขาตอบสนองความพึ่งพานี้ถ้า
(S, T) | = ∀¯x∀ Y (φs (x, y) - →∃¯zψt (x, Z)) นั่นก็คือเราคิดว่าตัวแปรใหม่บน
ขวาจะวัด existentially และคนอื่น ๆ ที่มีการวัดในระดับสากล นอกจากนี้เรายัง
ละเว้นจากปริมาณสัญกรณ์ชวเลขของเรา สัญชาตญาณตัวแปรใหม่ Z สอดคล้อง
กับค่านิยมใหม่ใส่ในเป้าหมาย: φsทุกครั้ง (x, y) เป็นที่พอใจ, tuples ใหม่จะใส่ใน
เป้าหมายที่จะตอบสนองความψt (x, Z) for z บาง
วารสาร ACM ฉบับ 61, ฉบับที่ 2, มาตรา 12, วันที่ประกาศ: เมษายน 2014
การแปล กรุณารอสักครู่..
XML Schema Mappings: Data Exchange and Metadata Management 12:7
(2-EXPTIME lower bound), and Theorem 7.6 (inequality, descendant, and horizontal
order).
Organization. Notations are given in Section 2. The schema mapping language is
described in Section 3. In Section 4, we study the membership problem. Complexity
of query answering is studied in Section 5. Static analysis problems are studied in
Section 6. Composition related problems are studied in Section 7. Concluding remarks
are given in Section 8.
2. PRELIMINARIES
2.1. XML Documents and DTDs
We view XML documents over a labeling alphabet of element types and a set of
attributes Att as structures T = (dom(T), ↓,→, lab, (ρa)a∈Att) where
—dom(T) is an unranked tree domain (a finite prefix-closed subset of N
∗ such that for
all n ∈ N, n · i ∈ dom(T) implies n · j ∈ dom(T) for all j < i);
—the binary relations ↓ and → are child (n ↓ n · i) and next sibling (n · i → n · (i 1));
—lab : dom(T) → is the labeling function; and
—each ρa is a partial function from dom(T) to V, the domain of attribute values, that
gives the values of a for all the nodes in dom(T) where it is defined.
By |T|,เราจะแสดง | ดอม ( T ) | นั่นคือ จำนวนขององค์ประกอบ ( โหนด ) ต้นแบบของต้นไม้ DOM โดเมน ( T )
.
a Language D กว่า กับ R สัญลักษณ์โดดเด่น ( ราก ) และการตั้งค่าของแอตทริบิวต์
ATT ประกอบด้วยแผนที่ PD จาก สีหน้าปกติ กว่า − { r } (
เขียนเป็นหนึ่งโดยทั่วไปการผลิต → keyboard - key - name E ถ้า PD ( ) = E ) และแผนที่โฆษณา : → keyboard - key - name 2att ที่
assigns a (possibly empty) set of attributes to each element type. We always assume,
for notational convenience, that attributes come in some order, just like in the relational
case: attributes in tuples come in some order so we can write R(a1, . . . , an). Likewise,
we shall describe an -labeled tree node with n attributes as (a1, . . . , an). Note that
arbitrary number of attributes can be modeled by trees with one attribute per node, by
using multiple children. Thus, the number of attributes will not play any special role
in our complexity results.
A tree T conforms to a DTD D (written as T |= D) if its root is labeled r, the set of
attributes for a node labeled is AD(), and the labels of the children of such a node,
read left-to-right, form a string in the language of PD().
We write D for the total size of D, or, in other words, the memory needed to store
a natural representation of D. We shall extend this notation to other complex objects
(sets of patterns, schema mappings, automata, etc.) as needed.
2.2. Relational Schema Mappings
We review the standard definitions of relational schema mappings, see Bernstein
และ เมลนิค [ 2007 ] เฟกิ้น et al . [ 2005 ] และ kolaitis [ 2005 ] ให้สองร่างแบบไม่ต่อเนื่อง
s ( ที่มา ) และ T ( เป้าหมาย ) , เป็นแหล่งพึ่งพิง เป้าหมายคือการแสดงออกของรูปแบบϕ
s ( ¯ X , ¯ Y ) −→ψ T ( ¯ X , ¯ Z ) ที่ϕเป็นคำเชื่อมของอะตอมมากกว่า
S และ T เป็นψร่วม ของอะตอมไปที ถ้าเรามีแหล่งที่มาของอินสแตนซ์
S และเป้าหมายของอินสแตนซ์ ที we say that they satisfy this dependency if
(S, T) |= ∀ ¯x∀ ¯y (ϕs( ¯x, ¯y)−→∃¯z ψt( ¯x, ¯z)). That is, we assume that new variables on the
right are quantified existentially, and the others are quantified universally. We also
omit quantifiers from our shorthand notation. Intuitively, new variables ¯z correspond
to new values put in the target: every time ϕs( ¯x, ¯y) is satisfied, new tuples are put in
the target to satisfy ψt( ¯x, ¯z) for some ¯z.
Journal of the ACM, Vol. 61, No. 2, Article 12, Publication date: April 2014.
การแปล กรุณารอสักครู่..