Cassandra 出現 HintsColumnFamily 異常巨大的解決辦法

2014-05-14

這陣子在 Cassandra 的使用上遇到個很麻煩的怪事，那就是 ring 上某個 node 發生HintsColumnFamily 異常巨大的情況。執行下述指令後

ls -lh {cassandra_data_folder}/system/HintsColumnFamily*

我發現 HintsColumnFamily 吃掉了 10儿G 的 HD，出問題的 node 跑起來跟快掛掉沒兩樣，實在是災難一場。

要如何解決這場災難，可以參考下列資料

coordinator node 負擔是否過重?資料寫入動作不要集中單一 coordinator node ，要分散到多個 node
coordinator node 在跟 ring 裡其它 node 進行通訊(cassandra gossiping)時，是否通訊不良?在 coordinator node 執行下述指令，看看發生 'Timed out replaying hint' 訊息的是哪儿個 node，想辦法改善這些 node 的網路品質
```
cat {cassandra_root_folder}/system.log | grep 'Timed out replaying hint' | less
```
因為 HintsColumnFamily 過於巨大，要等裡面的資料慢慢被消化完是無意義的。最有效率的解決辦法是直接刪除 HintsColumnFamily 檔案，把 hinted handoff 資料全部放生，然後再到各個發生 'Timed out replaying hint' 的 node 執行 repair 動作。處理步驟如下
1. 連線到 coordinator node
2. shutdown cassandra
```
nodetool -h coordinator_node disablegossip
nodetool -h coordinator_node disablethrift
nodetool -h coordinator_node drain
kill -9 {cassandra_service_pid}
```
3. ```
rm -rf {cassandra_data_folder}/system/HintsColumnFamily*
```
4. start cassandra
5. 連線到發生 'Timed out replaying hint' 的那儿個node，各別都執行下述指令，修復資料不一致的儿個 columnfamily
```
nodetool -h hint_fail_node repair {repaired_keyspace} {repaired_columnfamily} -pr
```
6. 如果不想讓 HintsColumnFamily 的資料保留時間過久，可以修改 coordinator node 的 cassandra.yaml 設定檔，將 max_hint_window_in_ms 設定值改小。這個設定值預設是 3600000，代表裡面的資料預設只保留 1 小時，時間超過時就會被系統自動清除