Quantcast
Channel: Dive Into A Data Deluge
Browsing all 35 articles
Browse latest View live

Image may be NSFW.
Clik here to view.

How to Create A Table in HBase for Beginners

I have accumulated some knowledge and know-how about MapReduce, Hadoop, and HBase since I participated in some projects. From hence, I’ll post the know-how of HBase by period. Today, I’m going to...

View Article



Image may be NSFW.
Clik here to view.

새로운 개념의 소셜 서비스 – Sekai Camera

Sekai Camera라는 어플이 앱스토어에 글로벌 버전으로 출시됐다고 한다. 살펴 보니 증강현실(augmented reality) + UCC + 소셜 네트워크를 이용한 새로운 개념의 소셜 서비스 인 것 같다. 최근 다양한 미디어와 디바이스를 바탕으로 한 이러한 서비스들이 우훅죽순으로 쏟아져 나오고 있는데 향후 3~5년 뒤가 참 기대된다. 더불어 이와...

View Article

Image may be NSFW.
Clik here to view.

애플 타플릿 IPad 발표 됐군요.

나오기 전부터 시끄럽더니 단순한 언론 플레이는 아니었던 것 같습니다. 아래 두 링크는 발표와 제품 사진, 그리고 동영상입니다. 가격이 $499 부터 시작한다는게 조금 부담이네요. http://www.engadget.com/2010/01/27/live-from-the-apple-tablet-latest-creation-event/...

View Article

Image may be NSFW.
Clik here to view.

Data-Intensive Text Processing with MapReduce Draft Available in Online

Data-Intensive Text Processing with MapReduce, Jimmy Lin and Chris Dyer Actually, there have never been books that directly deal with MapReduce programming and algorithms. This book addresses from...

View Article

Image may be NSFW.
Clik here to view.

Postgresql로 한글 full text search 시도기

최근 일이 있어 Postgresql을 이용한 full text search (FTS) 를 시도해보았다. Postgresql 자체가 역사가 긴 녀석이라 그런지 full text 검색 다양한 방법들을 제공했다. pgtrgm, tsearch2 와 같은 메소드를 제공하고 GIN (Generalized Inverted Index) 나 GiST (Generalized...

View Article


Image may be NSFW.
Clik here to view.

Hadoop RPC를 이용한 서버/클라이언트 구현

Hadoop은 이미 알려질대로 잘 알려진 분산 컴퓨팅 프레임워크입니다. 많은 사람들이 Hadoop 하면 MapReduce 프로그래밍을 주로 떠올리지만 자체적으로 제공하는 Hadoop RPC와 분산 파일 시스템인 HDFS를 가지고도 재미있는 것을 시도해 볼 수 있을 것 같습니다. 본 포스팅에서는 그 중에서 Hadoop RPC를 이용한 간단한 서버 클라이언트...

View Article

Image may be NSFW.
Clik here to view.

A Brief Summary of Independent Set in Graph Theory

Graph Basics Let G be a undirected graph. G=(V,E), where V is a set of vertices and E is a set of edges.  Every edge e in E consists of two vertices in V of G. It is said to connect, join, or link the...

View Article

Image may be NSFW.
Clik here to view.

HDFS Scalability 향상을 위한 시도들 (1)

얼마전 Yahoo!의 HDFS 팀에서 Multiple nodes를 사용하여 HDFS namenode의 Horizontal Scalability를 향상 시키는 방법을 제안 했었습니다 (HDFS-1052). 그런데 그 뒤로는 Dhruba Borthakur라는 Hadoop 커미터가 Vertical Scalability 개선 방법을 제안했습니다(The Curse...

View Article


Image may be NSFW.
Clik here to view.

VoltDB and its related links

There has been lots of buzz about VoltDB (academic name is H-Store [5]) since a week ago. VoltDB is lead by M. Stonebraker, and it is an open source OLTP DBMS. There are some interesting points:...

View Article


Image may be NSFW.
Clik here to view.

An Example of Hadoop MapReduce Counter

MapReduce Counter Hadoop MapReduce Counter provides a way to measure the progress or the number of operations that occur within MapReduce programs. Basically, MapReduce framework provides a number of...

View Article

Image may be NSFW.
Clik here to view.

Amazon EC2에서 whirr을 이용한 Hadoop 클러스터 구동 방법

최근 연구내용 검증을 위해 Amazon EC2에서 Hadoop 클러스터를 구축하여 실험을 수행 하는 중입니다. 그런데 Hadoop 클러스터를 EC2에 구축하는데 있어 Amazon EC2 환경에 대한 이해 부족과 자료의 부족으로 직접 부딪혀서 해결해야 하는 부분들이 꽤 있었습니다. 저는 이 포스팅을 통해 제가 시도했던 방법을 소개하고 제 경험을 공유하고자...

View Article

Image may be NSFW.
Clik here to view.

Tajo 개발 일지 시작

머리에만 의존하고 기록을 안하다 보니 스쳐 지나가는 아이디어나 버그 발견, TODO 리스트 정리가 쉽지 않다. 기록 자체가 생각 정리하는 좋은 방법이라는 것 또한 잘 알고 있지만 실천이 쉽지 않다.  사실 공책에 기록을 남기려 몇 차례 시도하였었다. 그러나 원채 필기하는 습관이 베지 않아 정리보다는 그때 그때 필요한 브레인 스토밍 북으로만 그치고 만다....

View Article

Image may be NSFW.
Clik here to view.

Jira의 Affect Version과 Fix Version의 차이

Jira를 쓰면서 어렴풋 하게 알고 있었는데 과연 잘 쓰고 있나 궁금하여 정의를 찾아보았다. https://answers.atlassian.com/questions/27953/difference-between-fix-version-and-affects-version 몇 가지 Q&A를 찾아 보았는데 모두 비슷하게 다음과 같은 의미를 가지고 있는 것...

View Article


Image may be NSFW.
Clik here to view.

float과 long 타입의 implicit casting

4 byte 짜리 float이 8 byte 짜리 long보다 widen 더 넓은 범위를 표현하는 type 이었다. 지금까지 Tajo에서 float 과 long의 산술 연산에서 둘다 double로 casting 하고 처리했었는데 사실은 long을 float으로 casting 한 후 해야 IEEE 754에 기반한 결과가 나오는 것이었음....

View Article

Image may be NSFW.
Clik here to view.

아파치 타조 (Apache Tajo)의 한글 문서화 프로젝트를 시작합니다.

Tajo를 더 보급해보려는 노력으로 Apache Tajo의 한글 문서화 프로젝트를 시작하려고 합니다. 자세한 내용은 아래 링크를 참고 하세요. https://github.com/hyunsik/tajo-doc-kr 일단은 번역으로 시작하지만 잘 작성된 내용은 upstream에 반영하려고 합니다. 막 github 저장소를 만들고 아직 번역된 내용은 없습니다만...

View Article


Image may be NSFW.
Clik here to view.

아파치 타조 (Apache Tajo) 한글 문서 프로젝트 리소스 및 진행 공유

지난 블로그 포스트 Tajo 한글 프로젝트 프로젝트를 시작에 대해 공유를 했습니다. 이 포스트에서는 짧았지만 몇 일간의 진행과 프로젝트 리소스 정보들을 공유합니다. 프로젝트 리소스 정보는 아래와 같습니다. 기본 웹 페이지 – http://hyunsik.github.io/tajo-doc-kr/ 두 페이지가 번역된 초안 –...

View Article

Image may be NSFW.
Clik here to view.

글쓰기 자동 공유 해제

가만 보니 워드프레스에 글을 쓰다말아 Draft로 표시된 글만 50여개이다. 초반에 글을 잘 쓰다가 다듬는 중에 나 스스로도 만족 못해서 완성을 못한 글들이 50여개 인데… 내 성격을 보여주는 단면인 것 같아서 씁쓸하기도 하다. 글 쓰긴 뿐만 아니라 다른 것들에서도 눈만 높은데 반해 내 실력이 막상 따라주지 못해 만족하지 못해 내놓지 못한 일들이 많다. 사실...

View Article


Image may be NSFW.
Clik here to view.

데이터베이스 시스템의 주제별 기초 논문들

데이터베이스 시스템 이라는 큰 주제 아래 각 세부 주제에 대한 기초 논문 목록 들이다. 한참 학교에서 공부하던 시절에 정리하고 틈틈히 업데이트 했던 것 같다. 추후에 data processing이나 column store에 대한 논문들도 공유하도록 하겠다. 데이터베이스 분야는 일반적으로 순수한 알고리즘이나 자료구조 부터 다양한 응용 문제나 이론까지 아주...

View Article

Image may be NSFW.
Clik here to view.

해쉬 함수 구현 (hash function implementation) 링크 정리

이것도 한 3-4년전에 정리했다가 가끔 업데이트 한 것 같은데… 나름 괜찮은 링크가 몇 개 있어 공유한다. 이것도 앞으로는 이 페이지에서 업데이트를 하겠다. 오래 지나다보니 인터넷에 있는 정보라도 링크가 깨진 것들이 많아 지웠는데 아쉽다. 다행히 이 페이지는 web archive에서 찾을 수 있어 다행이다 싶다. General Which hashing...

View Article

Image may be NSFW.
Clik here to view.

오픈소스 홍보를 위한 사이트 정리

오픈소스의 핵심은 커뮤니티와 사용자이기 때문에 홍보를 꾸준히 그리고 잘 해야 할 필요가 있다. 개발자 커뮤니티나 오픈소스 커뮤니티 사이트에서 홍보를 많이 하는데 매 릴리즈나 주요 로드맵 공개 때 마다 꾸준히 하는 것이 효과적이다. 추후 참고하기 위해 목록을 정리 한다. 글 또는 링크 포스트를 통한 홍보 사이트 https://www.reddit.com –...

View Article
Browsing all 35 articles
Browse latest View live




Latest Images