3. Data is the Next Intel Inside
Every significant internet application to date has been backed by a specialized database: Google's web crawl, Yahoo!'s directory (and web crawl), Amazon's database of products, eBay's database of products and sellers, MapQuest's map databases, Napster's distributed song database. As Hal Varian remarked in a personal conversation last year, "SQL is the new HTML." Database management is a core competency of Web 2.0 companies, so much so that we have sometimes referred to these applications as "infoware" rather than merely software.
This fact leads to a key question: Who owns the data?
In the internet era, one can already see a number of cases where control over the database has led to market control and outsized financial returns. The monopoly on domain name registry initially granted by government fiat to Network Solutions (later purchased by Verisign) was one of the first great moneymakers of the internet. While we've argued that business advantage via controlling software APIs is much more difficult in the age of the internet, control of key data sources is not, especially if those data sources are expensive to create or amenable to increasing returns via network effects.
Look at the copyright notices at the base of every map served by MapQuest, maps.yahoo.com, maps.msn.com, or maps.google.com, and you'll see the line "Maps copyright NavTeq, TeleAtlas," or with the new satellite imagery services, "Images copyright Digital Globe." These companies made substantial investments in their databases (NavTeq alone reportedly invested $750 million to build their database of street addresses and directions. Digital Globe spent $500 million to launch their own satellite to improve on government-supplied imagery.) NavTeq has gone so far as to imitate Intel's familiar Intel Inside logo: Cars with navigation systems bear the imprint, "NavTeq Onboard." Data is indeed the Intel Inside of these applications, a sole source component in systems whose software infrastructure is largely open source or otherwise commodified.
The now hotly contested web mapping arena demonstrates how a failure to understand the importance of owning an application's core data will eventually undercut its competitive position. MapQuest pioneered the web mapping category in 1995, yet when Yahoo!, and then Microsoft, and most recently Google, decided to enter the market, they were easily able to offer a competing application simply by licensing the same data.
Contrast, however, the position of Amazon.com. Like competitors such as Barnesandnoble.com, its original database came from ISBN registry provider R.R. Bowker. But unlike MapQuest, Amazon relentlessly enhanced the data, adding publisher-supplied data such as cover images, table of contents, index, and sample material. Even more importantly, they harnessed their users to annotate the data, such that after ten years, Amazon, not Bowker, is the primary source for bibliographic data on books, a reference source for scholars and librarians as well as consumers. Amazon also introduced their own proprietary identifier, the ASIN, which corresponds to the ISBN where one is present, and creates an equivalent namespace for products without one. Effectively, Amazon "embraced and extended" their data suppliers.
Imagine if MapQuest had done the same thing, harnessing their users to annotate maps and directions, adding layers of value. It would have been much more difficult for competitors to enter the market just by licensing the base data.
The recent introduction of Google Maps provides a living laboratory for the competition between application vendors and their data suppliers. Google's lightweight programming model has led to the creation of numerous value-added services in the form of mashups that link Google Maps with other internet-accessible data sources. Paul Rademacher's housingmaps.com, which combines Google Maps with Craigslist apartment rental and home purchase data to create an interactive housing search tool, is the pre-eminent example of such a mashup.
At present, these mashups are mostly innovative experiments, done by hackers. But entrepreneurial activity follows close behind. And already, one can see that for at least one class of developer, Google has taken the role of data source away from Navteq and inserted themselves as a favored intermediary. We expect to see battles between data suppliers and application vendors in the next few years, as both realize just how important certain classes of data will become as building blocks for Web 2.0 applications.
The race is on to own certain classes of core data: location, identity, calendaring of public events, product identifiers and namespaces. In many cases, where there is significant cost to create the data, there may be an opportunity for an Intel Inside style play, with a single source for the data. In others, the winner will be the company that first reaches critical mass via user aggregation, and turns that aggregated data into a system service.
For example, in the area of identity, PayPal, Amazon's 1-click, and the millions of users of communications systems, may all be legitimate contenders to build a network-wide identity database. (In this regard, Google's recent attempt to use cell phone numbers as an identifier for Gmail accounts may be a step towards embracing and extending the phone system.) Meanwhile, startups like Sxip are exploring the potential of federated identity, in quest of a kind of "distributed 1-click" that will provide a seamless Web 2.0 identity subsystem. In the area of calendaring, EVDB is an attempt to build the world's largest shared calendar via a wiki-style architecture of participation. While the jury's still out on the success of any particular startup or approach, it's clear that standards and solutions in these areas, effectively turning certain classes of data into reliable subsystems of the "internet operating system", will enable the next generation of applications.
A further point must be noted with regard to data, and that is user concerns about privacy and their rights to their own data. In many of the early web applications, copyright is only loosely enforced. For example, Amazon lays claim to any reviews submitted to the site, but in the absence of enforcement, people may repost the same review elsewhere. However, as companies begin to realize that control over data may be their chief source of competitive advantage, we may see heightened attempts at control.
Much as the rise of proprietary software led to the Free Software movement, we expect the rise of proprietary databases to result in a Free Data movement within the next decade. One can see early signs of this countervailing trend in open data projects such as Wikipedia, the Creative Commons, and in software projects like Greasemonkey, which allow users to take control of how data is displayed on their computer.
3 . ข้อมูล ข้อมูลถัดไปข้างใน
ทุกอย่างใช้งานอินเทอร์เน็ตวันที่ได้รับการสนับสนุนจากฐานข้อมูลเฉพาะ : Google เว็บคลาน , Yahoo ! เป็นไดเรกทอรี ( และเว็บรวบรวมข้อมูล ) , Amazon ของฐานข้อมูลของผลิตภัณฑ์ฐานข้อมูลของผลิตภัณฑ์ของอีเบย์และผู้ขาย , MapQuest แผนที่ฐานข้อมูล , Napster จัดจำหน่ายเพลงฐานข้อมูล เป็นเครื่องกล่าวในการสนทนาส่วนบุคคลฮาลปีที่แล้ว " SQL HTML ใหม่" การจัดการระบบฐานข้อมูลเป็นสมรรถนะหลักของ Web 2.0 บริษัท มากเพื่อให้เราได้บางครั้งเรียกว่าโปรแกรมเหล่านี้เป็น " infoware " มากกว่าเพียงแค่ซอฟต์แวร์
ความจริงนี้นำไปสู่คำถามที่สำคัญ : ผู้ที่เป็นเจ้าของข้อมูล
ในยุคอินเทอร์เน็ต หนึ่งสามารถดูหมายเลขของกรณีที่ควบคุมฐานข้อมูลมี led เพื่อควบคุมตลาดและผลตอบแทนทางการเงินขนาดใหญ่ .ผูกขาดในชื่อโดเมนรีจิสทรีได้รับเบื้องต้นโดยรัฐบาล เฟียต เพื่อแก้ไขปัญหาของเครือข่าย ( ซื้อต่อมาจาก Verisign ) เป็นหนึ่งในที่ยิ่งใหญ่ moneymakers แรกของอินเทอร์เน็ต ในขณะที่เราถกเถียงกันอยู่ว่า ความได้เปรียบทางธุรกิจซอฟต์แวร์ควบคุม APIs จะยากมากในยุคอินเทอร์เน็ต , ควบคุมแหล่งข้อมูลที่สำคัญคือ ไม่โดยเฉพาะอย่างยิ่งถ้าผู้แหล่งข้อมูลที่มีราคาแพงในการสร้างสิ่งอำนวยความสะดวกเพื่อเพิ่มผลตอบแทนหรือผ่านผลเครือข่าย
ดูลิขสิทธิ์ที่ฐานของทุกแผนที่ maps.yahoo.com MapQuest , บริการ , maps.msn.com หรือ maps.google.com , และคุณจะเห็นบรรทัด " แผนที่ลิขสิทธิ์ Navteq เทเล แอทลาส , " หรือกับใหม่ดาวเทียมบริการ " ภาพลิขสิทธิ์ดิจิตอลโลก" บริษัท เหล่านี้ได้ลงทุนอย่างมากในฐานข้อมูลของพวกเขา ( ของฉันคนเดียวรายงานการลงทุน $ 750 ล้านบาท เพื่อสร้างฐานข้อมูลของพวกเขาที่อยู่บนถนนและเส้นทาง โลกดิจิตอลการใช้จ่าย $ 500 ล้านบาทเพื่อเปิดดาวเทียมของตัวเองเพื่อปรับปรุงรัฐบาลจัดภาพ ) ของฉันได้ไปเท่าที่จะเลียนแบบ Intel Intel ภายในคุ้นเคยโลโก้รถยนต์ด้วยระบบนำร่องรอยหมี ," ของฉันบนเรือ ข้อมูล เป็นข้อมูลภายในของโปรแกรมเหล่านี้เป็นองค์ประกอบแหล่งที่มา แต่เพียงผู้เดียวในระบบที่มีซอฟต์แวร์โครงสร้างพื้นฐานเป็นแหล่งที่ส่วนใหญ่เปิด หรือมิฉะนั้น อภัย
ตอนนี้เวทีการประกวดอย่างรุนแรงการทำแผนที่เว็บสาธิตวิธีล้มเหลวที่จะเข้าใจความสำคัญของการเป็นเจ้าของข้อมูลหลักของโปรแกรมประยุกต์จะตัดราคาตำแหน่งการแข่งขันของMapQuest หัวหอกประเภทแผนที่เว็บในปี 1995 แต่เมื่อ Yahoo ! แล้ว Microsoft และส่วนใหญ่เมื่อเร็ว ๆนี้ Google ตัดสินใจที่จะเข้าสู่ตลาดที่พวกเขาได้อย่างง่ายดายสามารถที่จะเสนอการแข่งขันเป็นโปรแกรมง่ายๆโดยการใช้ข้อมูลเดียวกัน
แต่อย่างไรก็ตาม ตำแหน่งของ Amazon.com เหมือนคู่แข่ง เช่น barnesandnoble.com ฐานข้อมูลเดิมมาจาก ISBN Registry ผู้ให้บริการ r.r. อยู่ .แต่แตกต่างจาก MapQuest , Amazon มุ่งมั่นปรับปรุงข้อมูล เพิ่มข้อมูล เช่น จัดเผยแพร่ภาพปก , สารบัญ , ดัชนี , และวัสดุตัวอย่าง สําคัญยิ่ง พวกเขาควบคุมของผู้ใช้เพื่ออธิบายข้อมูล ซึ่งหลังจากสิบปี , Amazon ไม่ได้อยู่เป็นแหล่งหลักสำหรับข้อมูลบรรณานุกรมหนังสือเป็นแหล่งอ้างอิงสำหรับนักวิชาการและผู้ปฏิบัติงาน ตลอดจนผู้บริโภค Amazon แนะนำตนเองระบุกรรมสิทธิ์ , เกลือ , ซึ่งสอดคล้องกับ ISBN ที่ปัจจุบันและสร้าง namespace เทียบเท่าผลิตภัณฑ์โดยไม่ต้องหนึ่ง มีประสิทธิภาพ , Amazon " กอดและขยาย " ซัพพลายเออร์ของข้อมูลของพวกเขา .
นึกถ้า MapQuest ก็ทำเหมือนกันการควบคุมของผู้ใช้เพื่ออธิบายแผนที่และเส้นทาง , การเพิ่มชั้นของค่า มันคงจะยากมากสำหรับคู่แข่งเข้าสู่ตลาด โดยการออกใบอนุญาตข้อมูลฐาน
แนะนำล่าสุดของ Google Maps ให้อยู่ในห้องปฏิบัติการสำหรับการแข่งขันระหว่างผู้ขายใบสมัครและซัพพลายเออร์ของข้อมูลของพวกเขา .การเขียนโปรแกรมแบบ Google เบาได้นำไปสู่การสร้างบริการเสริมมากมายในรูปแบบของการผสมที่ลิงค์ Google Maps กับอินเทอร์เน็ตอื่น ๆสามารถเข้าถึงแหล่งข้อมูล . พอล rademacher housingmaps.com ซึ่งรวม Google Maps กับเช่าอพาร์ทเม้น Craigslist และข้อมูลการซื้อบ้านจะสร้างแบบที่อยู่อาศัย เครื่องมือค้นหาเป็น pre เด่นตัวอย่างเช่นตัว
ปัจจุบัน ผสมเหล่านี้การทดลองส่วนใหญ่นวัตกรรมที่ทำโดยแฮกเกอร์ แต่กิจกรรมที่เป็นแบบปิดหลัง . และแล้ว หนึ่งสามารถดูว่าอย่างน้อยหนึ่งชั้นเรียนของนักพัฒนา กูเกิล ได้ดำเนินการในบทบาทของแหล่งข้อมูลจากข้อมูลแผนที่และใส่ตัวเองเป็นโปรด คนกลาง เราคาดว่าจะเห็นการต่อสู้ระหว่างซัพพลายเออร์และข้อมูลผู้ขายใบสมัครในไม่กี่ปีถัดไปเป็นทั้งตระหนักถึงเพียงวิธีการที่สำคัญบางชั้นของข้อมูลจะกลายเป็นการสร้างบล็อกสำหรับ Web 2.0 โปรแกรม
แข่งกับตัวเองเรียนแน่นอนของข้อมูลหลัก : สถานที่ , เอกลักษณ์ , ปฏิทินของกิจกรรมสาธารณะ ระบุสินค้าและแทนที่ . ในหลายกรณี ซึ่งมีต้นทุนที่สําคัญในการสร้างข้อมูลที่อาจจะมีโอกาสสำหรับ Intel ภายในสไตล์การเล่นเป็นแหล่งเดียวของข้อมูล ในผู้อื่น ผู้ชนะจะเป็น บริษัท ที่แรกถึงมวลวิกฤติผ่านการรวมของผู้ใช้และเปลี่ยนที่รวบรวมข้อมูลในระบบบริการ
ตัวอย่างเช่น ในพื้นที่ของตน , PayPal , Amazon - 1 และล้านของผู้ใช้ระบบสื่อสารอาจจะถูกต้องตามกฎหมาย contenders จะสร้างเครือข่ายกว้าง เอกลักษณ์ของฐานข้อมูล ( ในส่วนนี้ของ Google ล่าสุดพยายามที่จะใช้โทรศัพท์มือถือหมายเลขตามที่ระบุในบัญชี Gmail อาจจะก้าวกอดและขยายระบบโทรศัพท์ ) สำหรับ startups เหมือน sxip จะสำรวจศักยภาพของสหพันธ์เอกลักษณ์ ในการแสวงหาของชนิดของ " การกระจาย - 1 " ว่า จะให้ราบรื่นเว็บ 2.0 ตัวนี้ ในพื้นที่ของปฏิทินevdb คือความพยายามที่จะสร้างโลกที่ใหญ่ที่สุดที่ใช้ร่วมกันปฏิทินผ่านรูปภาพลักษณะสถาปัตยกรรมของการมีส่วนร่วม ขณะที่คณะลูกขุนยังคงออกมาในความสำเร็จของการเริ่มต้นใด ๆหรือวิธีการ มันชัดเจนว่า มาตรฐานและโซลูชั่นในพื้นที่เหล่านี้ได้อย่างมีประสิทธิภาพการเรียนแน่นอนของข้อมูลในระบบย่อยที่เชื่อถือได้ของ Internet " ระบบปฏิบัติการ "จะช่วยให้รุ่นต่อไปของการใช้งาน .
จุดเพิ่มเติม ต้องสังเกตในเรื่องข้อมูลที่ผู้ใช้กังวลเกี่ยวกับความเป็นส่วนตัวและสิทธิข้อมูลของตนเอง หลายของการใช้งานเว็บแรก ลิขสิทธิ์เพียงหลวมๆ บังคับได้ ตัวอย่างเช่น Amazon วางเรียกร้องให้ความคิดเห็นใด ๆที่ส่งไปยังเว็บไซต์ แต่ในการบังคับ ใช้กฎหมายคนอาจจะขอโพสต์รีวิวเดียวกันที่อื่น ๆ อย่างไรก็ตาม ในฐานะที่เป็น บริษัท เริ่มที่จะตระหนักว่า การควบคุม ข้อมูลอาจเป็นแหล่งของความได้เปรียบในการแข่งขันของพวกเขา หัวหน้า เราอาจเห็นการเพิ่มความพยายามในการควบคุม
เท่าที่เพิ่มขึ้นของซอฟต์แวร์ลิขสิทธิ์ทำให้ขบวนการพัฒนาซอฟต์แวร์ เราคาดว่าการเพิ่มขึ้นของฐานข้อมูลที่เป็นกรรมสิทธิ์ที่จะส่งผลให้ข้อมูลฟรีการเคลื่อนไหวภายในทศวรรษหน้าหนึ่งสามารถเห็นสัญญาณแรกของแนวโน้มนี้ในจีนเปิดข้อมูลโครงการ เช่น วิกิพีเดีย ครีเอทีฟคอมมอนส์ และในโครงการซอฟต์แวร์ เช่น greasemonkey ซึ่งช่วยให้ผู้ใช้สามารถควบคุมวิธีการที่ข้อมูลจะถูกแสดงบนคอมพิวเตอร์ของพวกเขา
การแปล กรุณารอสักครู่..
