Chapt
er 14 discusses the following concepts:
Brief tutorial on Web client-server interactions
Unique characteristics of clickstream data, including the challenges of identifying
the visitors, their origin, and their complete session
Clickstream-specific dimensions, such as the page, event, session, and referral
dimensions
Clickstream fact tables for the complete session, individual page event, and an
aggregated summary
Integrating the clickstream data mart into the rest of the enterprise data warehouse
Web profitability data mart
Web Client-Server Interactions Tutorial
Understanding the interactions between a Web client (browser) and a Web
server (Web site) is essential for understanding the source and meaning of the
data in the clickstream. In Figure 14.1 we show a browser, designated “Visitor
Browser.” We’ll look at what happens in a typical interaction from the per
-
spective of a browser user. The browser and Web site interact with each other
across the Internet using the Web’s communication protocol—the HyperText
Transfer Protocol (HTTP).
First, the visitor clicks a button or hypertext link containing a Uniform
Resource Locator (URL) to access a particular Web site, shown as black-circled
action 1 in Figure 14.1. When this HTTP request reaches the Web site, the server
returns the requested item (action 2). In our illustration, this fetches a docu
-
ment in HyperText Markup Language (HTML) format—websitepage.html.
Once the document is entirely retrieved, the visitor’s browser scans web-
sitepage.html and notices several references to other Web documents that it
must fulfill before its work is completed; the browser must retrieve other com
-
ponents of this document in separate requests. Note that the only human
action taken here is to click on the original link. All the rest of the actions that
follow in this example are computer-to-computer interactions triggered by the
click and managed, for the most part, by instructions carried in the initially
downloaded HTML document, websitepage.html. In order to speed up Web
page responsiveness, most browsers will execute these consequential actions
in parallel, typically with up to 4 or more HTTP requests being serviced
concurrently.
The visitor’s browser finds a reference to an image—a logo perhaps—that,
from its URL, is located at Website.com, the same place it retrieved the initial
HTML document. The browser issues a second request to the server (action 3),
and the server responds by returning the specified image.
chapt
เอ้อ 14 กล่าวถึงแนวคิดต่อไปนี้ :
สั้น สอนบนเว็บไคลเอ็นต์เซิร์ฟเวอร์ของ
ลักษณะเฉพาะของการบำรุงรักษาปกติ รวมถึงความท้าทายของการระบุ
ผู้เข้าชมที่มาของพวกเขาและช่วงที่สมบูรณ์ของ
clickstream เฉพาะมิติ เช่นหน้างานเซสชัน และอ้างอิง
ขนาด clickstream ความเป็นจริงตารางสำหรับเซสชันที่สมบูรณ์หน้าเหตุการณ์ของแต่ละบุคคลและการสรุป
รวมรวมข้อมูล clickstream มาร์ทในส่วนที่เหลือขององค์กรคลังสินค้าข้อมูล
เว็บไรเว็บไคลเอ็นต์เซิร์ฟเวอร์การสื่อสารข้อมูลมาร์ท
เข้าใจปฏิสัมพันธ์ระหว่างการสอนบนเว็บ ( เบราว์เซอร์ของลูกค้า ) และเว็บ
Server ( เว็บไซต์ ) เป็นสิ่งจำเป็นสำหรับความเข้าใจ ที่มาและความหมายของข้อมูลใน clickstream
. ในรูปที่ 141 เราแสดงเบราว์เซอร์ , เขต " ผู้มาเยือน
เบราว์เซอร์ " เราจะมองสิ่งที่เกิดขึ้นในทั่วไปปฏิสัมพันธ์จากต่อ
-
spective ของเบราว์เซอร์ของผู้ใช้ เบราว์เซอร์และเว็บไซต์โต้ตอบกับแต่ละอื่น ๆ
ทางอินเทอร์เน็ตโดยใช้โปรโตคอลการสื่อสารของเว็บ Hypertext Transfer Protocol ( HTTP )
.
, ผู้เข้าชมคลิกปุ่มหรือไฮเปอร์ลิงค์ที่มีเครื่องแบบ
Resource Locator ( URL ) เพื่อการเข้าถึงเว็บไซต์ที่เฉพาะเจาะจง แสดงเป็นสีดำวงกลม
ปฏิบัติการ 1 ในรูปที่ 14.1 . เมื่อการร้องขอ HTTP ถึงเว็บไซต์ , เซิร์ฟเวอร์
จะขอรายการ ( ปฏิบัติการ 2 ) ในภาพของเรานี้ fetches DOCU
-
ment ใน Hypertext Markup Language ( HTML ) รูปแบบ websitepage . html .
เมื่อเอกสารทั้งหมดที่ได้มา ของผู้เข้าชมเว็บเบราว์เซอร์สแกน --
sitepage .HTML และประกาศการอ้างอิงหลายเอกสารที่เว็บอื่น ๆที่ต้องทำก่อนงาน
เสร็จ ; เบราว์เซอร์ต้องเรียกคนอื่นด้วย
-
ส่วนประกอบโดยทั่วไปของเอกสารนี้ในการแยกหน้า โปรดทราบว่าเฉพาะมนุษย์
กระทำคือคลิกที่ลิงค์เดิม ส่วนที่เหลือทั้งหมดของการกระทำที่
ตามในตัวอย่างนี้เป็นคอมพิวเตอร์คอมพิวเตอร์ปฏิสัมพันธ์ถูกทริกเกอร์ โดย
คลิกการจัดการ , ส่วนใหญ่ , โดยคำสั่งดำเนินการในตอนแรก
ดาวน์โหลดเอกสาร HTML websitepage.html . เพื่อเพิ่มความเร็วในการตอบสนองของหน้าเว็บเบราว์เซอร์ส่วนใหญ่จะรัน
ต่อการกระทำเหล่านี้ในแบบคู่ขนานโดยทั่วไปมีถึง 4 หรือมากกว่าการร้องขอ HTTP การได้รับบริการ
เยี่ยมพร้อม เบราว์เซอร์พบการอ้างอิงถึง image-a โลโก้บางทีที่
จาก URL ของมัน ตั้งอยู่ที่ website.com , สถานที่เดียวกันมันเรียกเอกสาร HTML เริ่มต้น
ประเด็นที่สอง ร้องขอไปยังเซิร์ฟเวอร์เบราว์เซอร์ ( ปฏิบัติการ 3 )
และเซิร์ฟเวอร์ตอบสนองกลับภาพที่ระบุไว้
การแปล กรุณารอสักครู่..
