变态重口极致另类在线-波多久久夜色精品国产-波多野结衣在线观看一区-波多野结衣在线观看一区二区-污污的网站免费阅读-污污视频网址

東坡下載:內容最豐富最安全的下載站!

幫助|文件類型庫|最新更新|下載分類|排行榜

說明書三農書屋計算機書庫健康書屋中小學教輔考試寶典經典名著電視說明書洗衣機說明書相機說明書健康教育公務員考試

首頁書籍教程計算機書庫 → 大規模Web服務開發技術(伊藤直也、田中慎司著 李劍 譯) 中文PDF完整版

大規模Web服務開發技術(伊藤直也、田中慎司著 李劍 譯)

大規模Web服務開發技術(伊藤直也、田中慎司著 李劍 譯)中文PDF完整版

  • 大。15.0M
  • 語言:中文
  • 平臺:WinAll
  • 更新:2017-08-06 23:26
  • 等級:
  • 類型:計算機書庫
  • 網站:暫無
  • 授權:免費軟件
  • 廠商:
  • 產地:國產軟件
好用好玩 50%(0)
坑爹 坑爹 50%(0)
軟件介紹軟件截圖相關軟件軟件教程網友評論下載地址

大規模Web服務開發技術是一本講訴數據庫的分布式方法、實用算法在系統中的應用、能支撐海量數據的搜索引擎的原理,以及統觀系統全局的基礎設施設計的知識等多個方面的書籍。是一本經典的web開發書籍,幫助用戶把知識系統化。

大規模Web服務開發技術內容簡介

Hatena 是日本最大的Web 服務提供商之一,它提供的服務包括關鍵字(類似于維基百科)、博客、相冊等。本書的內容主要來自Hatena 為學生們舉行的暑期實習的課程,內容涵蓋廣泛,介紹了性能優化、分布式、算法、系統架構等各個方面,甚至還介紹了硬件的經濟成本,是運維工程師們必不可少的參考書。書中還包括幾個算法實習課題,介紹了壓縮算法、全文搜索等算法的實現方法,對于打算靠Web 創業的人不失為一本很不錯的參考書。

大規模Web服務開發技術前言

自己開發的 Web 服務,以后規模增大時系統能否承受得起?從事Web 開發的諸位中很多人都有這個顧慮吧,或者是系統每天都會陷入困境,如何才能打破這種狀況?面對成長起來的Web 服務,整日愁眉苦臉的人一定存在吧。

我也有過完全相同的經歷。

Hatena 網站,月訪問人次1500 萬,而我們參與了規模如此龐大的系統的開發和運營。1000 臺服務器分擔負載,100 多萬用戶不停地發表博客或收藏社會化書簽,數據量每天都在激增,服務器資源頻頻告急。技術人員為了上GB、上TB 的數據量絞盡腦汁。即便如此,流量的波濤也從未平息過。

曾幾何時,Hatena 的團隊尚未成熟,面對規模日益增大的系統束手無策。龐大的數據和巨大的流量涌來,服務器宕機、服務停止。趕緊深夜跑過去重啟服務器,覺得總算能穩定了,清晨回家之后,發現服務器又宕機了,這種事情也曾面對過。

怎樣才能制服大規模服務這頭野獸?本書凝聚了 Hatena 的技術人員在反復試驗中得到的技術和訣竅——即大規模服務技術的地圖和指南。

本書是開發、運營大規模服務的技術者的入門書。Web 服務在不斷成長,當它的數據規模變大,處理起來也就不再易如反掌了,此時,怎樣做才是正確的?為了避免系統宕機,寫代碼時應該注意什么?設計高可擴展性(scalability)的系統時應該記住哪些要點?這些都是本書的內容。

Hatena 每年夏天都舉辦面向學生的、以就業體驗為目的的實習活動(Hatena Summer Intern)。這些實習活動會讓學生參與到Hatena 的系統開發中。我們把開發經驗很少的學生們與正式員工同樣看待,讓他們獲得大規模系統開發的成功經驗,這就是Hatena 之道。那么,我們希望學生們在開發之前知道什么呢?正是我們歷經坎坷學到的大規模服務的開發和運維的知識。

通過實習計劃,Hatena 的大規模服務技術的培訓方法也有了體系。本書就是以實習課程為基礎,試圖來說明大規模服務技術。

本書的內容從操作系統和計算機的原理開始,介紹數據庫的分布式方法、實用算法在系統中的應用、能支撐海量數據的搜索引擎的原理,以及統觀系統全局的基礎設施設計的知識等多個方面。

這是擁有 1500 萬用戶的Hatena 才能傳達的真實的、實踐性的技術和現場感。缺乏經驗的學生們在短短幾天的培訓中學到大規模服務開發所需的知識,在本書中得以系統化。本書融匯了這些知識,努力做到妙趣橫生、百讀不厭,并讓讀者學到真正的知識。

希望本書能成為從事 Web 服務開發的所有工程師們的得力助手和工具。

2010 年6 月

Hatena 株式會CTO 伊藤直也

大規模Web服務開發技術作品目錄

第 1 章大規模 Web 服務的開發定位——掌握整體..............2

第0 課本書的起源——本書講述的范圍................................... 3

從事大規模Web 服務開發——面向大學生的Hatena 實習... 3

本書講述的內容........................................................................ 3

本書不講述的內容.................................................................... 5

致今后從事大規模Web 服務的人........................................... 5

第1 課大規模服務和小規模服務................................................. 6

Hatena 的服務規模................................................................... 6

Hatena 是大規模,Google、Facebook 是超大規模................ 8

小規模服務和大規模服務的區別............................................ 9

應對大規模數據量.................................................................. 11

第2 課持續增長的服務和大規;恼系K............................ 13

Web 服務的困難...................................................................... 13

Hatena 的成長經歷................................................................. 13

系統增長戰略——最小化開端、預見變化的管理和設計... 17

第3 課服務開發現場...................................................................... 18

Hatena 的技術團隊體制.......................................................... 18

Hatena 的溝通方式................................................................. 19

服務開發的實際狀況.............................................................. 19

開發所用的工具...................................................................... 21

總結......................................................................................... 23

第2 章大規模數據處理入門

——內存和磁盤、Web 應用程序和負載..................24

第4 課 Hatena Bookmark 的數據規模....................................... 25

以Hatena Bookmark 為例介紹大規模數據........................... 25

Hatena Bookmark 的數據規模................................................ 25

針對大規模數據的查詢——處理大規模數據的感覺........... 26

第5 課大規模數據處理的難點——內存和磁盤....................28

為何處理大規模數據如此困難——因為無法在內存中

計算 ..........................................................................................28

內存和磁盤的速度差異——內存要快105~106 倍...............28

為何磁盤這么慢?——內存和磁盤.......................................29

操作系統層的加速處理..........................................................31

傳輸速度和總線的速度差異...................................................31

第6 課可擴展性的要點..................................................................37

擴展和可擴展性......................................................................37

可擴展性的要點——CPU 負載和I/O 負載...........................38

Web 應用程序和負載的關系..................................................38

數據庫的可擴展性很難保證...................................................39

第7 課處理大規模數據的基礎知識...........................................44

面向程序員的大規模數據的基礎...........................................44

處理大規模數據的三個重點——寫程序的技巧...................44

處理大規模數據之前的三大前提知識——程序開發的

底層基礎 ..................................................................................45

第3 章操作系統的緩存和分布式

——高效處理大規模數據的原理.................................50

第8 課操作系統的緩存機制........................................................51

在理解操作系統緩存的基礎上編寫應用程序——頁面

緩存 ..........................................................................................51

虛擬內存機制..........................................................................52

Linux 頁面緩存原理................................................................54

VFS...........................................................................................56

Linux 以頁面為單位緩存磁盤................................................57

內存空閑時就緩存——通過sar 確認.....................................59

增加內存降低I/O 負載...........................................................60

頁面緩存是透明的..................................................................61

第9 課降低 I/O 負載的策略.........................................................67

以緩存為前提的降低I/O 負載的策略...................................67

擴展到多臺服務器——無法全部緩存的情況.......................68

單純增加數量無法保證可擴展性...........................................69

第10 課利用局部性的分布式...................................................... 74

什么是利用局部性的分布式?............................................ 74

Partitioning——考慮局部性的分布式X.............................. 75

根據訪問模式分割成“島”——考慮局部性的分布式Y... 78

以頁面緩存為前提的基本應用規則.................................... 79

第4 章數據庫的橫向擴展策略

——以分布式為基礎的MySQL 應用.........................82

第11 課正確應用索引

——分布式MySQL 應用的大前提............................ 83

分布式MySQL 應用的三大要點........................................ 83

??靈活應用操作系統緩存.................................................... 83

索引的重點——B 樹............................................................ 86

索引的效果........................................................................... 89

確認索引是否有效的方法——explain 命令........................ 92

第12 課 MySQL 的分布式

——以擴展為前提的系統設計.................................... 95

MySQL 的replication 功能.................................................. 95

master/slave 的特征——對參照系進行擴展,更新類

不擴展 ................................................................................... 96

第13 課 MySQL 的橫向擴展和Partitioning ............................ 99

MySQL 的橫向擴展策略..................................................... 99

關于Partitioning(表分割)的補充.................................... 99

以Partitioning 為前提的設計............................................... 99

避免JOIN——利用where…in…......................................... 102

Partitioning 的代價............................................................. 103

第2~4 章的小結............................................................... 107

第5 章大規模數據處理“實踐”入門

——應用程序開發的重點.............................................108

第14 課特殊用途索引——處理大規模數據........................ 109

索引和系統架構——超過RDBMS 的處理能力時........... 109

特殊用途索引——使用調優后的數據結構.......................111

第15 課理論聯系實踐..................................................................115

探尋必須的技術條件..........................................................115

第2~5 章小結....................................................................117

第6 章壓縮編程

——考慮數據大小和I/O 加速之間的關系.............118

第16 課[課題]以緊湊、簡潔方式保存整數數據..............119

以緊湊方式保存整數數據..................................................119

出題意圖——解決該課題有什么好處?...........................119

課題所用文件的內容..........................................................121

第17 課可變字節碼和速度的感覺...........................................122

可變字節碼——用緊湊格式保存整數數據.......................122

可變字節碼的偽代碼..........................................................123

用“差”存儲已排序整數..................................................126

(補充??)壓縮的基礎........................................................126

(補充??)壓縮對象是整數的情形——背景理論.............127

第18 課課題詳解及解答范例....................................................129

課題詳解..............................................................................129

(參考??)pack()函數——將Perl 內部數據結構以

二進制形式輸出..................................................................131

(參考??)二進制數據的read/write ...................................133

(參考??)性能分析............................................................135

解答范例和思路..................................................................136

第7 章算法實用化

——從身邊的例子來看理論、研究的實踐投入....142

第19 課算法和算法評測.............................................................143

數據規模和復雜度的差異..................................................143

何謂算法?..........................................................................144

學習算法的意義——計算機資源有限,工程師的通用

語言......................................................................................145

算法評測——復雜度記法...................................................146

紙巾能折疊幾次?——O(logn)和O(n)的差距..................148

算法和數據結構——千絲萬縷的聯系...............................149

復雜度和常數項——評測很重要.......................................150

應用算法的實際情況——簡單就是美.............................. 151

靈活應用第三方實現——CPAN 等................................... 153

通過實例加深感受............................................................. 155

第20 課 Hatena Diary 的關鍵字鏈接........................................ 156

什么是關鍵字鏈接? ......................................................... 156

最初的實現......................................................................... 156

出問題了!——關鍵字字典越來越大.............................. 157

用模式匹配實現關鍵字鏈接的問題.................................. 158

從正則表達式到Trie——改變匹配的實現方式............... 158

Aho-Corasick 算法.............................................................. 160

換成Regexp::List................................................................ 162

關鍵字鏈接的實現、變遷和考察...................................... 163

第21 課 Hatena Bookmark 的文章分類................................... 164

什么是文章分類? ............................................................. 164

機器學習和大規模數據..................................................... 165

大規模數據和Web 服務——The Google Way of Science ... 166

貝葉斯過濾器的原理......................................................... 167

算法實用化之路——Hatena Bookmark 的實例................ 170

防守姿態和進攻姿態——從文檔分類功能說開去........... 171

第8 章 Hatena 關鍵字鏈接的實現

——理解通向應用之路..................................................176

第22 課[課題]創建Hatena 關鍵字鏈接............................. 177

使用Aho-Corasick 算法創建Hatena 關鍵字鏈接............ 177

編寫測試............................................................................. 180

第23 課解答范例和思路............................................................. 182

解答范例............................................................................. 182

第9 章挑戰全文搜索技術

——各種各樣的大規模數據處理經驗技巧...........184

第24 課全文搜索技術的應用范圍.......................................... 185

用Hatena 的數據創建搜索引擎........................................ 185

Hatena Diray 的全文搜索——搜索服務之外的搜索

系統..................................................................................... 185

Hatena Bookmark 的全文搜索——滿足細節要求的系統... 187

第25 課搜索系統的架構.............................................................190

搜索系統所需的步驟..........................................................190

各種各樣的搜索引擎..........................................................191

全文搜索的種類..................................................................193

第26 課搜索引擎的內部結構....................................................198

逆向索引的結構——Dictionary+Postings..........................198

Dictionary 的創建方法——逆向索引的創建方法1 .........200

小結......................................................................................210

Postings 的創建方法——逆向索引的創建方法2 ............211

關于評分的補充..................................................................213

參考文獻..............................................................................214

第10 章創建全文搜索引擎

——基本部分、改進、速度和準確度的要求....216

第27 課[課題]創建Hatena Bookmark 全文搜索..............217

開發全文搜索引擎..............................................................217

課題內容..............................................................................217

示例數據格式和數據大小..................................................218

字典的組成——Dictionary、Postings ................................219

界面......................................................................................220

基礎部分+改進...................................................................220

以速度和準確度一決勝負..................................................221

第28 課答案范例和思路.............................................................223

解答范例..............................................................................223

indexer pl 的實現.................................................................223

searcher pl 的實現................................................................225

可以改善的地方..................................................................227

第11 章支持大規模數據處理的服務器/基礎設施入門

—— Web 服務的后臺..................................................230

第29 課企業軟件vs. Web 服務.................................................231

企業軟件vs. Web 服務——應用范圍上的差異................231

Web 服務的基礎設施——三個重點..................................233

第30 課云 vs.自行構建基礎設施..............................................235

云計算..................................................................................235

云的優缺點......................................................................... 235

Hatena 應用的云服務......................................................... 236

自行構筑基礎設施的優點................................................. 237

自行構建基礎設施和垂直結合模型.................................. 239

Hatena 的服務規模............................................................. 240

Hatena Bookmark 的系統架構圖....................................... 240

第12 章保證可擴展性的必要思路

——規模擴大和系統擴展..........................................242

第31 課層和可擴展性................................................................. 243

對可擴展性的要求——一臺服務器能處理的流量極限.... 243

各層的可擴展性................................................................. 244

第32 課掌握負載進行調優........................................................ 245

掌握負載——可視化的管理界面...................................... 245

測量負載的指標——平均負載、內存和CPU 相關信息.... 247

根據用途進行調優——面向用戶的服務器和面向爬蟲

的服務器 ............................................................................. 247

應用程序服務器、數據庫服務器的調優策略和服務器

數量 ..................................................................................... 249

服務規模和調優................................................................. 250

保證可擴展性..................................................................... 251

第13 章保證冗余性和系統的穩定化

——實現100%在線率的原理..................................252

第33 課保證冗余性...................................................................... 253

保證冗余性——應用程序服務器...................................... 253

保證冗余性——數據庫服務器.......................................... 254

保證冗余性——存儲服務器.............................................. 257

第34 課系統穩定化...................................................................... 261

保持系統穩定的權衡......................................................... 261

系統的不穩定因素............................................................. 262

第35 課系統穩定對策................................................................. 267

實際的系統穩定對策——維持適當余量,消滅不穩定

因素 ..................................................................................... 267

第14 章提高效率

——提高硬件資源的使用率......................................270

第36 課虛擬化技術......................................................................271

引入虛擬化技術..................................................................271

虛擬化技術的效果..............................................................272

虛擬服務器的構建策略......................................................273

總結虛擬化的優勢..............................................................275

虛擬化和運營——通過服務器管理工具在運營上發揮

虛擬化的優勢......................................................................276

虛擬化的注意點..................................................................277

第37 課硬件和提高效率

——實現低成本的關鍵技術........................................280

提高處理器性能..................................................................280

內存和硬盤成本下降..........................................................281

有效利用廉價硬件——以虛擬化為前提的硬件應用.......282

SSD ......................................................................................284

第15 章 Web 服務和網絡

——通過網絡看服務增長...........................................288

第38 課網絡的分界點..................................................................289

服務增長和網絡的分界點..................................................289

1Gbps 的極限——PC 路由器的極限.................................289

500 臺主機的極限——子網、ARP 表的極限...................290

網絡架構的層次化..............................................................291

全球化..................................................................................292

第39 課挑戰更高的極限.............................................................295

超越10Gbps 的世界...........................................................295

Hatena 的基礎設施——第11~15 章的總結.....................296

第16 章特別篇 當前構建Web 服務需要的實踐技術

——應對大規模Web 服務須知...............................298

特別篇第1 課作業隊列系統TheSchwartz、Gearman .......299

Web 服務和請求......................................................299

作業隊列系統入門...................................................299

Hatena 的作業隊列系統..........................................300

通過日志進行分析.................................................. 302

特別篇第2 課存儲方式的選擇RDBMS 還是

key-value 存儲..................................................... 303

如何保存不斷增加的數據...................................... 303

選擇存儲系統的前提條件...................................... 304

存儲系統的種類...................................................... 305

RDBMS.................................................................... 305

分布式key-value 存儲............................................ 308

分布式文件系統...................................................... 310

其他存儲.................................................................. 312

存儲系統的選擇策略.............................................. 314

特別篇第3 課緩存系統——Squid、Varnish......................... 315

Web 應用程序負載與代理/緩存系統..................... 315

Squid——基本結構................................................. 317

Varnish...................................................................... 321

特別篇第4 課計算集群——Hadoop........................................ 323

大量日志數據的并行處理 ...................................... 323

MapReduce 計算模型.............................................. 323

Hadoop ..................................................................... 325

索引..................................................................................................327

PC官方
安卓官方手機版
IOS官方手機版

大規模Web服務開發技術(伊藤直也、田中慎司著 李劍 譯)截圖

下載地址

大規模Web服務開發技術(伊藤直也、田中慎司著 李劍 譯) 中文PDF完整版

熱門評論
最新評論
昵稱:
表情: 高興 可 汗 我不要 害羞 好 下下下 送花 屎 親親
字數: 0/500 (您的評論需要經過審核才能顯示)

編輯推薦

本類軟件必備

報錯

請簡要描述您遇到的錯誤,我們將盡快予以修正。

轉帖到論壇
輪壇轉帖HTML方式

輪壇轉帖UBB方式

主站蜘蛛池模板: 91短视频在线观看免费最新 | 91视频一88av | www.黄色片.com | 日韩ab| 精品在线免费播放 | 国产精品亚洲精品观看不卡 | 深夜免费福利 | 午夜爽| 欧美另类高清xxxxx | 国产在线一区二区三区在线 | 欧美一级片在线免费观看 | 日本免费专区 | 看黄色一级视频 | 日本肥妇 | 免费看h成年漫画在线观看 免费看a级 | 一级毛片视频免费 | 天天操操操操操操 | 国产午夜不卡在线观看视频666 | 免费黄色小视频网站 | 国产伦精一区二区三区视频 | 亚洲成综合人影院在院播放 | 亚洲乱码一二三四区国产 | 国产精品久久一区一区 | 亚洲免费网址 | 日本操穴 | 高清一级毛片 | 青草青青在线视频 | 欧美成人做性视频在线播放 | 久久97精品久久久久久久不卡 | 日韩中文字幕a | 国产精品1页 | 日本三级香港三级人妇 m | 亚洲国产成人久久综合一区 | 一级片在线免费播放 | 国产一卡2卡3卡免费网站 | 久久er国产精品免费观看2 | jzzjlzz亚洲乱熟在线播放 | 成人午夜视频在线观看 | 国产区精品福利在线观看精品 | 黄色福利网址 | 性爱免费视频 |