Articles Posted in the " Big Data " Category

  • Facebook เปิดซอร์ส Presto เครื่องมือคิวรีข้อมูลขนาดใหญ่

    Facebook เปิดซอร์ส Presto เครื่องมือคิวรีข้อมูลขนาดใหญ่

    อธิบายสั้นๆ มันคือคู่แข่งของ Apache Hive ที่พัฒนาโดย Facebook ครับ อธิบายแบบยาวๆ คือบริษัทแบบ Facebook ที่ต้องยุ่งเกี่ยวกับข้อมูลจำนวนมหาศาลระดับ petabyte มีงานเบื้องหลังที่ต้องดึงข้อมูลเก่าที่เก็บใน data warehouse (ที่เก็บด้วย Hadoop/HFS) มาวิเคราะห์อยู่บ่อยๆ ปัญหาคือระบบคิวรีข้อมูลอย่าง Hive ที่พัฒนาอยู่บนแนวคิด MapReduce นั้นออกแบบโดยเน้นสมรรถภาพโดยรวม (overall throughput) เป็นสำคัญ แต่สิ่งที่ Facebook


  • Facebook อธิบายสถาปัตยกรรมเบื้องหลัง Open Graph รันด้วย Apache Giraph

    Facebook อธิบายสถาปัตยกรรมเบื้องหลัง Open Graph รันด้วย Apache Giraph

    Facebook เป็นเครือข่ายสังคมที่เชื่อมโยง “ความสัมพันธ์” ของผู้คนและวัตถุต่างๆ ซึ่งบริษัทได้ออกแบบแพลตฟอร์ม Open Graph มารองรับฟีเจอร์นี้ (ข่าวเปิดตัวเมื่อปี 2010) ระยะหลัง Facebook จึงมองข้อมูลต่างๆ ในระบบของตัวเองเป็น “กราฟ” (ในความหมายทางคณิตศาสตร์ ไม่ใช้กราฟเส้นแบบราคาหุ้นนะครับ) ไปซะเยอะ



  • อินเทลประกาศเปิดตัว Hadoop รุ่นพิเศษ_หรับ xenon

    อินเทลประกาศเปิดตัว Hadoop รุ่นพิเศษ_หรับ xenon

    อินเทลประกาศเปิดตัว Hadoop เฟรมเวิร์ค MapReduce โอเพนซอร์สรุ่นพิเศษของตัวเอง ที่ใช้ฟีเจอร์ของชิป Xeon อย่างเต็มประสิทธิภาพ ด้วยการใช้ชุดคำสั่งพิเศษอย่าง AES-NI หรือ SSE เพื่อเพิ่มประสิทธิภาพการเข้ารหัสและการบีบอัด รวมถึงการจูนระบบไฟล์ HDFS ให้ทำงานเข้ากับ Intel SSD และการ์ด 10Gbps ของอินเทลได้ดีขึ้น