具有NULL的唯一键

这个问题需要一些假设的背景。让我们考虑一个employee有列的表namedate_of_birthtitlesalary,使用MySQL作为RDBMS。由于如果给定的某个人的名字和出生日期与另一个人相同,那么根据定义,他们就是同一个人(除非有两个巧合,即我们两个人分别于1809年2月12日出生,他们叫亚伯拉罕·林肯),所以我们将上的唯一键namedate_of_birth这意味着“不要将同一个人存储两次”。现在考虑以下数据:

id name        date_of_birth title          salary

1 John Smith 1960-10-02 President 500,000

2 Jane Doe 1982-05-05 Accountant 80,000

3 Jim Johnson NULL Office Manager 40,000

4 Tim Smith 1899-04-11 Janitor 95,000

如果现在尝试运行以下语句,则该语句应该并且将失败:

INSERT INTO employee (name, date_of_birth, title, salary)

VALUES ('Tim Smith', '1899-04-11', 'Janitor', '95,000')

如果我尝试此操作,它将成功:

INSERT INTO employee (name, title, salary)

VALUES ('Jim Johnson', 'Office Manager', '40,000')

现在,我的数据将如下所示:

id name        date_of_birth title          salary

1 John Smith 1960-10-02 President 500,000

2 Jane Doe 1982-05-05 Accountant 80,000

3 Jim Johnson NULL Office Manager 40,000

4 Tim Smith 1899-04-11 Janitor 95,000

5 Jim Johnson NULL Office Manager 40,000

这不是我想要的,但是我不能说我完全不同意发生的事情。如果说数学集

{'Tim Smith', '1899-04-11'} = {'Tim Smith', '1899-04-11'} <-- TRUE

{'Tim Smith', '1899-04-11'} = {'Jane Doe', '1982-05-05'} <-- FALSE

{'Tim Smith', '1899-04-11'} = {'Jim Johnson', NULL} <-- UNKNOWN

{'Jim Johnson', NULL} = {'Jim Johnson', NULL} <-- UNKNOWN

我的猜测是MySQL说:“由于我不 知道NULL出生日期的吉姆·约翰逊不在此表中,因此我将其添加。”

我的问题是:

到目前为止,我想出的最好的办法是移到date_of_birth另一张桌子。但是,这样做的问题是,我最终可能会遇到两个出纳员,他们的名字,头衔和薪水相同,出生日期不同,而且没有重复的方式就无法存储它们。

回答:

基本属性是它必须是唯一的。使该键成为Nullable的一部分会破坏此属性。

有两种可能的解决方案来解决您的问题:

  • 一种方法(错误的方法)是使用一些魔术日期来表示未知数。这只是使您克服了DBMS的“问题”,但并不能从逻辑上解决问题。预期两个“约翰·史密斯”条目的生日不明的问题。这些家伙是同一个人还是独特的个人?如果您知道它们不同,那么您又回到了同样的旧问题-您的唯一密钥不是唯一的。甚至不要考虑分配一个完整的魔术日期来表示“未知”,这确实是通往地狱的道路。

  • 更好的方法是将EmployeeId属性创建为代理键。这只是您分配给 唯一的个人的任意标识符。该标识符通常只是一个整数值。然后创建一个Employee表,以将EmployeeId(唯一的,不可为空的键)与您认为是依赖属性的属性相关联,在这种情况下,名称和出生日期(其中任何一个都可以为空)。在以前使用姓名/生日的任何地方使用EmployeeId代理键。这将向您的系统添加一个新表,但是以一种可靠的方式解决了未知值的问题。

以上是 具有NULL的唯一键 的全部内容, 来源链接: utcz.com/qa/399611.html

回到顶部