목록분산 (3)
Dharma
샤딩 (Sharding) 을 하는 방법 또는 복제 셋 (Replication) 을 하는 방법에 관한 예제는 잘 나와 있습니다. 그런데 실전에서는 복제와 샤딩을 동시에 하는 것이 일반적일 것입니다. 이것에 관한 예제가 많이 없더군요. 어쩌다 찾은 것이 한개 있지만 한 기계에서 가상으로 돌려보는 예제 입니다. 이러한 예제로는 샤딩을 제대로 테스트 할 수가 없더군요. 하지만 그 문서를 바탕으로 실제로 샤딩과 복제를 클러스터 환경에서 테스트 해 봤습니다. http://cookbook.mongodb.org/operations/convert-replica-set-to-replicated-shard-cluster/ 위 내용은 한 기계안에서 샤딩과 복제 셋을 테스트 하는 예제 입니다. 원칙대로라면 복제 셋 (Repli..
화살표는 신경 쓰지 맙시다.. Consistency : 일관성 각각의 사용자가 항상 동일한 데이터를 조회한다. Availability : 가용성 모든 사용자가 항상 읽고 쓸 수 있다. Partition Tolerance : 확장 가능성 물리적 네트워크 분산 환경에서 시스템이 잘 동작한다. 기존의 RDBMS 로 칭해지는 데이타베이스들은 CA 에 취중합니다. 따라서 확장이 용이하지가 않고, 대신 최근 트렌드가 되고 있는 NoSQL 들은 기본적으로 P 의 성능이 좋습니다. 그래서 확장성은 기본입니다. 대신 C 나 A 의 일부분을 희생합니다. 카산드라 (Cassandra) 는 AP 를 추구 하고, HBase 는 CP 를 추구합니다. 카산드라는 페이스북이 채택하고 개발해진 것으로 알려지고 유명해 졌는데요. Con..
어디가서 기술 모른다고 기 죽지 말고 들어본 것처럼 말 할 필요가 있는 매니져분들을 위한 1분 짜리 하둡 정리 입니다.더 복잡하고 더 깊이 있는 내용은 '공부'를 해야 하기 때문에 제가 내세우는 취지와는 안 맞을 것입니다. 하둡의 화두는 '분산' 입니다. 하둡은 두가지 큰 요소의 결합입니다. '처리(계산)' 와 '저장' 입니다. 즉 '분산처리' 와 '분산저장' 이라고 보면 됩니다. 여러개의 저가형 컴퓨터를 마치 하나인것 처럼 묶어주는 기술이라고 보면 됩니다. (그래서 계산 능력과 저장 공간을 늘립니다) 분산저장 하둡 파일시스템(HDFS: Hadoop Distributed File System) 을 이용해서 파일을 적당한 블록 사이즈 (64MB)로 나눠서 각 노드 클러스터(각각의 개별 컴퓨터) 에 저장합니..