PHP将定界字符串拆分为键/值对(关联数组)
我有一个像这样的字符串:
key1\value1\key2\value2\key3\value3\key4\value4\key5\value5
我希望它是一个关联数组,以便可以执行以下操作:
echo $myArray['key1']; // prints value1echo $myArray['key3']; // prints value3
//etc...
我知道我可以在反斜杠上爆炸,但不确定如何从那里开始。
回答:
通过和使用简单的正则表达式通常是最短和最快的选择:preg_match_all
array_combine
preg_match_all("/([^\\\\]+)\\\\([^\\\\]+)/", $string, $p); $array = array_combine($p[1], $p[2]);
现在,这当然是一个特例。 键 和 值 都以\
反斜杠分隔,所有 键对 和 值 也是如此。由于必须进行两次转义,因此正则表达式也更长一些。
但是,可以将该方案推广到其他key:value,
样式的字符串。
不同的key:value,
分隔符
常见的变体包括:
和=
作为键/值分隔符,和,
/ &
和其他作为对定界符。在这种情况下,正则表达式变得非常明显(带有/x
可读性标记):
# ↓ ↓ ↓ preg_match_all("/ ([^:]+) : ([^,]+) /x", $string, $p);
$array = array_combine($p[1], $p[2]);
这使得超级容易交流:
和,
其他分隔符。
- 等号
=
代替:
冒号。 - 例如
\\t
作为对定界符(制表符分隔的键:值列表) - 经典
&
或;
作为键=值对之间的分隔符。 - 甚至只是
\\s
空格或\\n
换行符。
允许使用不同的定界符
您可以通过在键/值/对之间使用不同的分隔符来使其更加灵活/宽容:
# ↓ ↓ ↓ preg_match_all("/ ([^:=]+) [:=]+ ([^,+&]+) /x", $string, $p);
两者key=value,key2:value2++key3==value3
都会在哪里工作。对于更多的人际友好(AKA非技术用户),这可能更有意义。
约束字母数字键
通常,您可能要禁止除经典key
标识符以外的任何内容。只需使用\w+
字串模式即可使正则表达式跳过不必要的事件:
# ↓ ↓ ↓ preg_match_all("/ (\w+) = ([^,]+) /x", $string, $p);
这是最简单的白名单方法。如果是OTOH,您想预先 声明
/约束整个键/值字符串,则可以单独制作一个preg_match("/^(\w+=[^,]+(,|$))+/", …
删除空格或引用
您可以跳过一些后处理步骤(例如trim
在键和值上),并添加少量内容:
preg_match_all("/ \s*([^=]+) \s*=\s* ([^,]+) (?<!\s) /x", $string, $p);
或例如可选引号:
preg_match_all("/ \s*([^=]+) \s*=\s* '? ([^,]+) (?<![\s']) /x", $string, $p);
INI样式提取
您可以设计基准INI文件提取方法:
preg_match_all("/^ \s*(\w+) \s*=\s* ['\"]?(.+?)['\"]? \s* $/xm", $string, $p);
请注意,这只是普通INI方案的 粗略子集 。
选择: parse_str()
如果您已经有一个key=value&key2=value2
字符串,那么它parse_str
就像一个符咒。但是通过与它结合strtr
甚至可以处理其他定界符:
# ↓↓ ↑↑ parse_str(strtr($string, ":,", "=&"), $pairs);
它有两个 :
- 甚至比两行正则表达式方法还短。
- 预定义一种众所周知的转义机制,例如
%2F
特殊字符)。 - 不允许在其中使用不同的定界符或未转义的定界符。
- 自动转换
keys[]=
为数组,您可能想要也可能不需要。
另类:explode
+foreach
您会发现许多手动键/值字符串扩展的示例。尽管这通常是更多的代码。explode
由于优化假设,在PHP中有些过度使用。分析后,由于手动foreach
和数组收集,通常发现速度较慢。
以上是 PHP将定界字符串拆分为键/值对(关联数组) 的全部内容, 来源链接: utcz.com/qa/416941.html