MySql PHP 从逗号分隔的数据(标签)中选择不同值的计数

2024-03-06

如何从 MySql 中以逗号分隔值存储的数据中选择不同值的计数?最后我将使用 PHP 从 MySql 输出数据。

里面有每个帖子的标签。所以最后,我尝试输出数据,就像 stackoverflow 处理标签的方式一样,如下所示:

tag-name x 5

这就是表中数据的样子(对内容感到抱歉,但这是一个食谱网站)。

"postId"    "tags"                                  "category-code"
"1"         "pho,pork"                              "1"
"2"         "fried-rice,chicken"                    "1"
"3"         "fried-rice,pork"                       "1"
"4"         "chicken-calzone,chicken"               "1"
"5"         "fettuccine,chicken"                    "1"
"6"         "spaghetti,chicken"                     "1"
"7"         "spaghetti,chorizo"                     "1"
"8"         "spaghetti,meat-balls"                  "1"
"9"         "miso-soup"                             "1"
"10"        "chanko-nabe"                           "1"
"11"        "chicken-manchurian,chicken,manchurain" "1"
"12"        "pork-manchurian,pork,manchurain"       "1"
"13"        "sweet-and-sour-pork,pork"              "1"
"14"        "peking-duck,duck"                      "1"

Output

chicken             5 // occurs 5 time in the data above
pork                4 // occurs 4 time in the data above
spaghetti           3 // an so on
fried-rice          2
manchurian          2
pho                 1
chicken-calzone     1
fettuccine          1
chorizo             1
meat-balls          1
miso-soup           1
chanko-nabe         1
chicken-manchurian  1
pork-manchurian     1
sweet-n-sour-pork   1
peking-duck         1
duck                1

我正在尝试select count of all distinct values in there,但由于它是逗号分隔的数据,因此似乎无法做到这一点。select distinct不管用。

你能想出一个像我一样在 mysql 或使用 php 中获取输出的好方法吗?


Solution

我真的不知道如何将逗号分隔值的水平列表转换为行列表,而不创建包含数字的表,与可能有逗号分隔值的数字一样多。如果你可以创建这个表,这是我的答案:

SELECT 
  SUBSTRING_INDEX(SUBSTRING_INDEX(all_tags, ',', num), ',', -1) AS one_tag,
  COUNT(*) AS cnt
FROM (
  SELECT
    GROUP_CONCAT(tags separator ',') AS all_tags,
    LENGTH(GROUP_CONCAT(tags SEPARATOR ',')) - LENGTH(REPLACE(GROUP_CONCAT(tags SEPARATOR ','), ',', '')) + 1 AS count_tags
  FROM test
) t
JOIN numbers n
ON n.num <= t.count_tags
GROUP BY one_tag
ORDER BY cnt DESC;

Returns:

+---------------------+-----+
| one_tag             | cnt |
+---------------------+-----+
| chicken             |   5 |
| pork                |   4 |
| spaghetti           |   3 |
| fried-rice          |   2 |
| manchurain          |   2 |
| pho                 |   1 |
| chicken-calzone     |   1 |
| fettuccine          |   1 |
| chorizo             |   1 |
| meat-balls          |   1 |
| miso-soup           |   1 |
| chanko-nabe         |   1 |
| chicken-manchurian  |   1 |
| pork-manchurian     |   1 |
| sweet-and-sour-pork |   1 |
| peking-duck         |   1 |
| duck                |   1 |
+---------------------+-----+
17 rows in set (0.01 sec)

See sqlfiddle http://sqlfiddle.com/#!2/37010/2


解释

Scenario

  1. 我们使用逗号连接所有标签,仅创建一个标签列表,而不是每行一个
  2. 我们计算列表中有多少个标签
  3. 我们找到如何获取此列表中的一个值
  4. 我们找到了如何将所有值作为不同的行获取
  5. 我们计算按其值分组的标签

Context

让我们构建您的架构:

CREATE TABLE test (
    id INT PRIMARY KEY,
    tags VARCHAR(255)
);

INSERT INTO test VALUES
    ("1",         "pho,pork"),
    ("2",         "fried-rice,chicken"),
    ("3",         "fried-rice,pork"),
    ("4",         "chicken-calzone,chicken"),
    ("5",         "fettuccine,chicken"),
    ("6",         "spaghetti,chicken"),
    ("7",         "spaghetti,chorizo"),
    ("8",         "spaghetti,meat-balls"),
    ("9",         "miso-soup"),
    ("10",        "chanko-nabe"),
    ("11",        "chicken-manchurian,chicken,manchurain"),
    ("12",        "pork-manchurian,pork,manchurain"),
    ("13",        "sweet-and-sour-pork,pork"),
    ("14",        "peking-duck,duck");

连接所有标签列表

我们将在一行中处理所有标签,因此我们使用GROUP_CONCAT做这项工作:

SELECT GROUP_CONCAT(tags SEPARATOR ',') FROM test;

返回以逗号分隔的所有标签:

河粉,猪肉,炒饭,鸡肉,炒饭,猪肉,鸡肉馅饼,鸡肉,宽面条,鸡肉,意大利面,鸡肉,意大利面,香肠,意大利面,肉丸,味噌汤,相扑火锅,鸡肉-满洲里,鸡肉,满洲里,猪肉满洲里,猪肉,满洲里,咕噜肉,猪肉,北京烤鸭,鸭

统计所有标签

为了计算所有标签,我们得到完整标签列表的长度,并在替换后删除完整标签列表的长度,无缘无故。我们添加 1,因为分隔符位于两个值之间。

SELECT LENGTH(GROUP_CONCAT(tags SEPARATOR ',')) - LENGTH(REPLACE(GROUP_CONCAT(tags SEPARATOR ','), ',', '')) + 1 AS count_tags
FROM test;

Returns:

+------------+
| count_tags |
+------------+
|         28 |
+------------+
1 row in set (0.00 sec)

获取标签列表中的第N个标签

我们使用SUBSTRING_INDEX函数得到

-- returns the string until the 2nd delimiter\'s occurrence from left to right: a,b
SELECT SUBSTRING_INDEX('a,b,c', ',', 2);

-- return the string until the 1st delimiter, from right to left: c
SELECT SUBSTRING_INDEX('a,b,c', ',', -1);

-- we need both to get: b (with 2 being the tag number)
SELECT SUBSTRING_INDEX(SUBSTRING_INDEX('a,b,c', ',', 2), ',', -1);

通过这样的逻辑,为了获取列表中的第三个标签,我们使用:

SELECT SUBSTRING_INDEX(SUBSTRING_INDEX(GROUP_CONCAT(tags SEPARATOR ','), ',', 3), ',', -1)
FROM test;

Returns:

+-------------------------------------------------------------------------------------+
| SUBSTRING_INDEX(SUBSTRING_INDEX(GROUP_CONCAT(tags SEPARATOR ','), ',', 3), ',', -1) |
+-------------------------------------------------------------------------------------+
| fried-rice                                                                          |
+-------------------------------------------------------------------------------------+
1 row in set (0.00 sec)

获取所有值作为不同的行

我的想法有点棘手:

  1. 我知道我们可以通过连接表来创建行
  2. 我需要使用上面的请求获取列表中的第 N 个标签

因此,我们将创建一个表,其中包含从 1 到列表中可能拥有的最大标签数的所有数字。如果您可以拥有 1M 个值,请创建从 1 到 1,000,000 的 1M 个条目。对于 100 个标签,这将是:

CREATE TABLE numbers (
  num INT PRIMARY KEY
);

INSERT INTO numbers VALUES
    ( 1 ), ( 2 ), ( 3 ), ( 4 ), ( 5 ), ( 6 ), ( 7 ), ( 8 ), ( 9 ), ( 10 ), 
    ( 11 ), ( 12 ), ( 13 ), ( 14 ), ( 15 ), ( 16 ), ( 17 ), ( 18 ), ( 19 ), ( 20 ), 
    ( 21 ), ( 22 ), ( 23 ), ( 24 ), ( 25 ), ( 26 ), ( 27 ), ( 28 ), ( 29 ), ( 30 ), 
    ( 31 ), ( 32 ), ( 33 ), ( 34 ), ( 35 ), ( 36 ), ( 37 ), ( 38 ), ( 39 ), ( 40 ), 
    ( 41 ), ( 42 ), ( 43 ), ( 44 ), ( 45 ), ( 46 ), ( 47 ), ( 48 ), ( 49 ), ( 50 ), 
    ( 51 ), ( 52 ), ( 53 ), ( 54 ), ( 55 ), ( 56 ), ( 57 ), ( 58 ), ( 59 ), ( 60 ), 
    ( 61 ), ( 62 ), ( 63 ), ( 64 ), ( 65 ), ( 66 ), ( 67 ), ( 68 ), ( 69 ), ( 70 ), 
    ( 71 ), ( 72 ), ( 73 ), ( 74 ), ( 75 ), ( 76 ), ( 77 ), ( 78 ), ( 79 ), ( 80 ), 
    ( 81 ), ( 82 ), ( 83 ), ( 84 ), ( 85 ), ( 86 ), ( 87 ), ( 88 ), ( 89 ), ( 90 ), 
    ( 91 ), ( 92 ), ( 93 ), ( 94 ), ( 95 ), ( 96 ), ( 97 ), ( 98 ), ( 99 ), ( 100 );

现在,我们得到num(修女是一排number)使用以下查询:

SELECT n.num, SUBSTRING_INDEX(SUBSTRING_INDEX(all_tags, ',', num), ',', -1) as one_tag
FROM (
  SELECT
    GROUP_CONCAT(tags SEPARATOR ',') AS all_tags,
    LENGTH(GROUP_CONCAT(tags SEPARATOR ',')) - LENGTH(REPLACE(GROUP_CONCAT(tags SEPARATOR ','), ',', '')) + 1 AS count_tags
  FROM test
) t
JOIN numbers n
ON n.num <= t.count_tags

Returns:

+-----+---------------------+
| num | one_tag             |
+-----+---------------------+
|   1 | pho                 |
|   2 | pork                |
|   3 | fried-rice          |
|   4 | chicken             |
|   5 | fried-rice          |
|   6 | pork                |
|   7 | chicken-calzone     |
|   8 | chicken             |
|   9 | fettuccine          |
|  10 | chicken             |
|  11 | spaghetti           |
|  12 | chicken             |
|  13 | spaghetti           |
|  14 | chorizo             |
|  15 | spaghetti           |
|  16 | meat-balls          |
|  17 | miso-soup           |
|  18 | chanko-nabe         |
|  19 | chicken-manchurian  |
|  20 | chicken             |
|  21 | manchurain          |
|  22 | pork-manchurian     |
|  23 | pork                |
|  24 | manchurain          |
|  25 | sweet-and-sour-pork |
|  26 | pork                |
|  27 | peking-duck         |
|  28 | duck                |
+-----+---------------------+
28 rows in set (0.01 sec)

计算标签出现次数

只要我们现在有classic行,我们可以轻松计算每个标签的出现次数。

See the 这个答案的顶部 https://stackoverflow.com/a/26916814/731138查看请求。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

MySql PHP 从逗号分隔的数据(标签)中选择不同值的计数 的相关文章

随机推荐

  • iOS显示tableview标题图像(视差效果)

    我正在尝试设置一个大图像 随着表格视图进一步拉低 可以显示更多信息 我知道我没有任何意义 它更容易显示我从 netbot 记录的一个例子 http vine co v bdKrALdOheD 请让我知道正确的术语是什么 我将更新标题 Upd
  • Task.perform 期望第三个参数是不同的类型

    我正在尝试将 Elm 教程改编为我自己的小项目 但我在使用我提供的 Json Decoder 时遇到了麻烦 我的代码如下所示 type Msg RetrieveComments FetchSucceed String FetchFail H
  • Hibernate:多个结果集

    从我在 Hibernate 文档 在线中读到的内容来看 听起来 Hibernate 没有处理多个结果集的能力 我希望在依赖 Hibernate 的应用程序中进行 MySQL DB 调用 这将返回多个结果集 您使用过哪些解决方案可以与 Hib
  • Eclipse 不会将 jar 部署到 WEB-INF/lib 目录中

    为了将 JSF 与 Spring 集成 我在中添加了这些行web xml
  • 使用 prometheus 和 grafana 跟踪事件

    有一篇文章 跟踪每个版本 https codeascraft com 2010 12 08 track every release 它讲述了如何在每个代码部署的图表上显示一条垂直线 他们正在使用石墨 我想用 Prometheus 2 2 和
  • OpenCV 从 BGR 颜色转换为灰度时出错

    我正在尝试使用以下代码将图像从 BGR 转换为灰度格式 img cv2 imread path to image file gray cv2 cvtColor img cv2 COLOR BGR2GRAY 这似乎工作正常 我检查了数据类型i
  • 没有 php.ini 与brew

    我用brew安装了PHP7 它说 The php ini file can be found in usr local etc php 7 0 php ini 但我在那里什么也没看到 所以我确认了php fpm i Configuratio
  • 嵌入、嵌入高级或动态地图之间的区别

    我正在使用 Google Maps Javascript API 将地图添加到网站 现在 当谷歌改变他们的价格时 我不确定我的极限是多少 这site https cloud google com maps platform pricing
  • 如何刷新 DbContext

    我想刷新我的所有实体DbContext在没有重新创建它的情况下 我尝试了以下操作 但没有一个有意义 var context IObjectContextAdapter myDbContext ObjectContext var refres
  • 在 Windows 上构建 Boost

    我正在尝试使用 mingw 在 Windows 7 x64 机器上构建 boost 库 当我尝试运行 b2 时 b2 build dir C boost build toolset gcc with python 构建库时出现错误 Jamr
  • C# 在包含任何字符的设置中序列化 List 的方法 (Regex/xml)

    我正在寻找一种简洁 干净的方法将字符串列表存储到C 设置 http msdn microsoft com en us library aa730869 28VS 80 29 aspx文件 据我所知 您无法将 List 对象存储到这些设置中
  • SQL Server 2005中的连接错误

    我有一个问题 我运行应用程序 C 并收到错误 与网络相关或 发生特定于实例的错误 建立与 SQL 的连接 服务器 找不到服务器或 无法访问 验证 实例名称正确且 SQL 服务器配置为允许远程 连接 提供商 SQL 网络 接口 错误 26 错
  • 如何将 iMessage 扩展的 sqlite 存储文件下载到 MacBook

    我们正在开发 iMessage 扩展 它成功地使用了核心数据 我们需要评估 store sqlite 文件 但找不到它 我们尝试这样找到它 在 Xcode 中 窗口 gt 设备 In Installed Apps 选择我们的扩展 Downl
  • 如何使用 gmock 测试类是否调用其基类的方法

    class Foo public int x int y void move void class SuperFoo public Foo public int age void update SuperFoo update void mo
  • 自定义验证在版本 4.1.1 的联系表单 7 中不起作用

    我必须在联系表单 7 中制作一个带有自定义验证字段的表单 它不适用于联系表单 7 的最新版本 4 1 1 但适用于旧版本 我创建了一个用于从表单获取优惠券代码的字段 如果优惠券是从 HIP 开始的 我想验证该条目 我的代码如下 add fi
  • 如何“git pull”到非当前分支的分支?

    当你跑步时git pull on the master分支 它通常从origin master 我在另一个名为newbranch 但我需要运行一个执行以下操作的命令git pull from origin master into maste
  • 重新启动 kube-proxy 等待条件

    在 Windows 10 中运行 minikube start 时 出现以下错误 错误 重新启动集群时出错 重新启动 kube proxy 等待 kube proxy 启动以进行 configmap 更新 等待条件超时 请帮我解决给定的问题
  • Delphi DataSnap 框架向 JSON 消息添加内容

    我正在使用 Delphi XE DataSnap REST 服务器并尝试返回 JSON 序列化对象 我的方法返回给客户端的结果如下所示 type ServerMethodsUnit1 TJSONIssue id 1 fields FIssu
  • SyntaxError:解析错误仅发生在 safari 中

    我收到 SyntaxError Parse Error 仅在 safari 上 这是有问题的代码
  • MySql PHP 从逗号分隔的数据(标签)中选择不同值的计数

    如何从 MySql 中以逗号分隔值存储的数据中选择不同值的计数 最后我将使用 PHP 从 MySql 输出数据 里面有每个帖子的标签 所以最后 我尝试输出数据 就像 stackoverflow 处理标签的方式一样 如下所示 tag name