Book

หนังสือที่ได้อ่าน

Hadoop : Meet Hadoop

Submitted by joezine on Tue, 04/06/2010 - 01:28

Introduction

  • บทแรกแค่เกริ่นถึง “ทำไมต้อง Hadoop” เพราะปัจจุบันมี Data ที่ไหลเวียนผ่านเข้ามาบน Internet เป็นจำนวนมาก
  • พอมีข้อมูลเยอะแล้ว สิ่งที่ต้องคำนึงถึงคือ Capacity ของ Storage ที่เพิ่มมากขึ้นทุกวันๆ (และดู Techonology ของ Storage ว่า 1 TB จะใช้เวลาอ่านมากน้อยแค่ไหน)
  • ปัญหาที่ 1 Hardware Fail ล่ะ ? เพราะมีอุปกรณ์เป็นจำนวนมาก โอกาสที่ Hardware Fail มีสูง
  • ปัญหาที่ 2 การวิเคราะห์งาน ใน 1 งานอาจต้องอ่าน/เขียน ข้อมูล 1 Set ลงใน Harddisk หลายก้อน ทีนี้จะสามารถคำนวณเรื่อง Set ของ Key และ Value ยังไง
  • Hadoop สามารถตอบโจทย์ข้อ 1 โดย HDFS และข้อ 2 โดย MapReduce
  • Data Locality เป็นหัวใจของ MapReduce ช่วย Recognizing network bandwidth
  • MPI เป็นเครื่องมือช่วยให้ Programmer จัดการกลไลของ Data Flow
Tags: | »

Hadoop

Submitted by joezine on Sun, 04/04/2010 - 21:22

เพราะ Facebook ทำให้อยากทำความรู้จักกับ Hadoop

292-1

โหลดมาเรียบร้อย แต่จะอ่านจบรึเปล่านี่อีกเรื่อง!!!

Tags: | »

ปั่นข้ามฝัน 2,000 วันรอบโลก : อัศจรรย์เอเซีย

Submitted by joezine on Sun, 04/04/2010 - 03:33

เล่มสุดท้ายของชุดปั่นจักรยานรอบโลก ใช้เวลาอ่านไม่นานมาก เพราะอ่านสนุกและเหมือนได้เข้าไปสัมผัสกับการเดินทางด้วยตัวเอง

เดาว่า คงประทับใจกับการปั่นแถบเอเซียเป็นอย่างมาก โดยเฉพาะอย่างยิ่งประเทศจีน สังเกตจากการเก็บรายละเอียด โดยเฉพาะอย่างยิ่งอาหาร

IMG_6718

ประเทศที่ผ่าน ยูเครน -> รัสเซีย -> คาซัคสถาน -> อุสเบกิสถาน -> จีน -> เวียดนาม -> ลาว -> กัมพูชา -> ไทย (สิ้นสุด)

สรุปสิ่งที่น่าสนใจตามนี้

อาหาร

Tags: | »