MySQL:低基数/选择性列=如何建立索引?
我需要在表(列)中添加索引,并在这篇文章中偶然发现:
多少数据库索引太多?
Quote:“话虽如此,您可以清楚地向表添加很多毫无意义的索引,这些索引不会执行任何操作。将B-
Tree索引添加到具有2个不同值的列中将毫无意义,因为它在查找数据方面不会增加任何内容。列中的值越独特,则从索引中受益越多。”
如果只有两个不同的值,索引真的没有意义吗?给定如下表(MySQL数据库,InnoDB)
Id (BIGINT)fullname (VARCHAR)
address (VARCHAR)
status (VARCHAR)
进一步的条件:
- 该数据库包含3亿条记录
- 状态只能是“启用”和“禁用”
- 1.5亿条记录的状态为启用,而1.5亿条记录的状态为禁用
我的理解是,在没有状态索引的情况下,带有select的选择where status=’enabled’
将导致具有3亿条记录的完整表扫描处理?
在状态上使用BTREE索引时查询的效率如何?
我应该索引此列吗?
MySQL InnoDB提供什么替代方法(可能是其他索引),以给定示例中的“基数/选择性非常低”的方式通过“ where status =“
enabled”子句有效地查找记录?
回答:
您描述的索引几乎没有意义。索引是最好的使用,当你需要选择一个 相比,总行的行数。
这样做的原因与数据库访问表的方式有关。可以通过全表扫描评估表,在该表中依次读取和处理每个块。或通过rowid或键查找,其中数据库具有键/行并读取所需的确切行。
如果您使用基于主键或另一个唯一索引的where子句,例如 where id =
1,数据库可以使用索引来获取对行数据存储位置的精确引用。这显然比进行全表扫描和处理每个块更有效。
现在回到您的示例,您有一个where子句where status =
'enabled',该索引将返回150m行,并且数据库将不得不使用单独的小读取依次读取每一行。而通过全表扫描访问表允许数据库利用更有效的较大读取。
最好只进行全表扫描而不是使用索引。使用mysql时,您可以将其FORCE INDEX
(idx_name)用作查询的一部分,以允许在每个表访问方法之间进行比较。
- 参考:http
- //dev.mysql.com/doc/refman/5.5/en/how-to-avoid-table-
scan.html
以上是 MySQL:低基数/选择性列=如何建立索引? 的全部内容, 来源链接: utcz.com/qa/431217.html