Database model
3.1 Schema definition
The TVSM has been tested by implementing it in a
relational database using the following statements (we
assume that an index on all unique or primary key
attributes is automatically created by the database):
CREATE TABLE document (
id INTEGER UNIQUE NOT NULL,
length DOUBLE PRECISION DEFAULT NULL;
text TEXT NOT NULL,
PRIMARY KEY(id));
CREATE TABLE term (
id INTEGER UNIQUE NOT NULL,
text TEXT UNIQUE NOT NULL,
weight DOUBLE PRECISION DEFAULT NULL,
PRIMARY KEY(id));
CREATE TABLE doc_term_ass (
document INTEGER NOT NULL
REFERENCES document(id),
term INTEGER NOT NULL
REFERENCES term(id),
quantity INTEGER NOT NULL,
PRIMARY KEY(document, term));
CREATE INDEX doc_term_ass_term_document_idx
ON doc_term_ass (term, document);
CREATE TABLE skalarproduct (
term1 INTEGER NOT NULL
REFERENCES term(id),
term2 INTEGER NOT NULL
REFERENCES term(id),
value DOUBLE PRECISION NOT NULL,
PRIMARY KEY(term1, term2));
Table “document” stores text as well as unnormed
document-vector length k δ
แบบจำลองฐานข้อมูล
3.1 คำนิยามเค้าร่าง
TVSM ได้รับการทดสอบ โดยใช้ในการ
ฐานข้อมูลเชิงสัมพันธ์ที่ใช้คำสั่งต่อไปนี้ (เรา
สมมุติว่าดัชนีคีย์หลัก หรือไม่ซ้ำกันทั้งหมด
โดยอัตโนมัติสร้างแอตทริบิวต์ โดยฐานข้อมูล):
เอกสารสร้างตาราง (
รหัสเต็มเฉพาะไม่ NULL,
ยาวคู่ความแม่นยำเริ่มต้น NULL;
ข้อความข้อความที่ไม่เป็น NULL,
KEY(id) หลัก);
ระยะสร้างตาราง (
รหัสเต็มเฉพาะไม่ NULL,
ข้อความข้อความเฉพาะไม่ NULL,
น้ำหนักคู่ความแม่นยำเริ่มต้น NULL,
KEY(id) หลัก);
doc_term_ass สร้างตาราง (
เอกสารเต็มไม่ NULL
เอกสารอ้างอิง (รหัส),
ระยะเต็มไม่ NULL
คำอ้างอิง (id),
ปริมาณเต็มไม่ NULL,
คีย์หลัก (เอกสาร คำ));
สร้างดัชนี doc_term_ass_term_document_idx
บน doc_term_ass (ระยะ เอกสาร);
skalarproduct สร้างตาราง (
term1 จำนวนเต็มไม่เป็น NULL
คำอ้างอิง (id),
term2 จำนวนเต็มไม่เป็น NULL
คำอ้างอิง (รหัส),
ค่าคู่ความแม่นยำไม่ NULL,
คีย์หลัก (term1, term2));
"เอกสาร" ตารางจัดเก็บข้อความเป็น unnormed
เวกเตอร์เอกสารความยาวδ k
การแปล กรุณารอสักครู่..