哪个工具可以更好地将数据加载到cassandra?

我们将使用cassandra在我们的项目中存储.csv和非结构化数据。 数据可以写入GB。所以我想知道哪个更好的方法或工具来将数据加载到Cassandra中。 SSTables可以处理这么多的数据? 或者我应该去找火花或YCSB等工具?哪个工具可以更好地将数据加载到cassandra?

回答:

(声明:我是一个ScyllaDB员工)

SStables可以在这个尺寸数据容易(也更...)

如果你在的SSTable格式的数据比我的存储强烈建议使用SStableLoader实用程序。 没有任何参数运行将显示选项和用法列表。最重要的是sstables目录和节点IP。 我建议对预准备语句使用-x标志,因为它提高了性能。

例子:

  • sstableloader -x -d [node IP] .../[ks]/[table]
  • sstableloader -x -d [node IP] .../[mount point] (in /[ks]/[table] format)

另一种选择是使用批量复制。例如:copy keyspace1.table1 FROM 'a.csv' WITH HEADER=TRUE;

我建议你阅读这个blog关于Cassandra和Scylla中大数据集的摄取率。 另一个blog你可以找到关于加载来自各种数据库架构的数据。

祝你好运,快乐的加载。

以上是 哪个工具可以更好地将数据加载到cassandra? 的全部内容, 来源链接: utcz.com/qa/261031.html

回到顶部