优化捕获出勤数据模式的最佳方法是什么

2023-12-11

我们有一个体育训练营，该市的各个团队定期参加该训练营。我们每天有一次持续 2 小时（上午 9 点至 11 点）的会议，不同团队的时间段可能有所不同。我们希望了解每天参加训练营的人员情况。

我们采用以下模型来捕获出席率。（id、user_id、日期、当前）。假设用户每天参加训练营（比如一个月 30 天），您将在数据库中看到这么多记录。

假设我们只对找出用户参加训练营的天数感兴趣，是否有更好的方法来标记特定用户的存在或缺席（也许只是一个月的单行并将所有单独的天标记为类似于 (P,P,P,A, ...,A,P)。P = 存在，A = 不存在

您在问题标题中使用“优化”一词而没有解释你想要优化什么.

如果您谈论的是查询性能，那么您就没有问题。您可以拥有的记录数量取决于您每天参加的会议数量（因为只有一个团队可以参加任何给定的会议）。如果您每天运行十个会话，那么每月就有三百条记录。如果您每天运行一百个会话，则每月会产生三千条记录。这些数据量并不大。因此，您通过扭曲数据库设计来避免不存在的性能问题，从而做出了错误的决定。

您在评论中提到了电子表格。这并不是一个糟糕的设计。顶行是会议，下方是团队，单元格显示团队是否出席会议。它们映射到三个数据库表：SESSIONS、TEAMS 和交集表 TEAM_SESSIONS。当团队参加会议时，您只需要在 TEAM_SESSIONS 中记录。

作为概念验证，我在 Oracle 中创建了三个表。

SQL> desc teams
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 ID                                        NOT NULL NUMBER
 NAME                                               VARCHAR2(20 CHAR)

SQL> desc sessions
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 ID                                        NOT NULL NUMBER
 SSN_DAY                                            DATE
 SSN_START                                          NUMBER(4,2)
 SSN_END                                            NUMBER(4,2)

SQL> desc team_sessions
 Name                                      Null?    Type
 ----------------------------------------- -------- ----------------------------
 TEAM_ID                                   NOT NULL NUMBER
 SESSION_ID                                NOT NULL NUMBER

SQL>

Oracle 11g 中引入的 PIVOT 函数使得构建矩阵变得轻而易举（不同风格的 DBMS 将有不同的方法来实现这一点）。正如您所看到的，三支球队今天已经预订了课程，没有人愿意在午餐时间训练，而贝克联队则非常热衷（或需要训练）！

SQL> select * from (
  2      select t.name as team_name
  3             , trim(to_char(s.ssn_start))||'-'||trim(to_char(s.ssn_end)) as ssn
  4             , case when ts.team_id is not null then 1 else 0 end as present
  5      from   sessions s
  6             cross join teams t
  7             left outer join team_sessions ts
  8                  on (ts.team_id = t.id
  9                      and ts.session_id = s.id )
 10      where s.ssn_day = trunc(sysdate)
 11      )
 12  pivot
 13      ( sum (present)
 14        for ssn in ( '9-11', '11-13', '13-15', '15-17', '17-19')
 15      )
 16  order by team_name
 17  /

TEAM_NAME                '9-11'    '11-13'    '13-15'    '15-17'    '17-19'
-------------------- ---------- ---------- ---------- ---------- ----------
Balham Blazers                0          1          0          0          0
Bec United                    1          0          0          0          1
Dinamo Tooting                0          0          0          0          0
Melchester Rovers             0          0          0          1          0

SQL>

无论如何，这个数据模型的优点是它是灵活的。我们可以统计团队参加的频率、参加的时间、参加一周中的哪一天、哪些会议总是被预订、哪些会议很少被预订等等。此外，管理数据也很容易。特别是，三桌解决方案相对于两桌解决方案的优势在于，更容易防止重复预订以及非标准或重叠的时段。

你看，正常化不仅仅是我们用来迷惑无辜者的某种月球语言，它提供了真正的实际好处。在某些情况下，降低到至少 BCNF 并不是最好的主意。

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

优化捕获出勤数据模式的最佳方法是什么的相关文章

为什么使用散列来为大量文件创建路径名？

我注意到在许多情况下应用程序或数据库使用 has 来存储文件 blob 集合来确定路径和文件名我相信预期的结果是路径永远不会太深或者文件夹太满文件夹中的文件或文件夹太多导致访问速度变慢编辑示例通常是数字图书馆或存储库尽管
两种表结构的区别

我对这两种结构很困惑这两个表各有什么优缺点哪一个更好为什么 TABLE1 反模式在常见情况下第二个表是反模式在数据库设计的背景下而且更重要的是它有特定的名称实体属性值 EAV 在某些情况下使用这种设计是合理的但这种
Postgres 动态创建序列

我正在编写一个应用程序其中有多个用户用户可以在应用程序内上传报告目前我有一个报告表其中包含所有提交的报告其中有一个 id 字段该字段是表上的序列主键我指定的要求是用户需要能够指定其报告开始计数的前缀和数字例如用户应
使用 MongoDB 有效确定层次结构中记录的所有者

我正在努力实现以下目标选择我拥有的所有记录其中所有权是我创建的对象或我管理的用户创建的对象其中用户管理可以在管理用户的用户层次结构中所有权显然很简单可以通过与所有者相对应的简单 ID 来处理用户管理的层次结构让我有点难以执行而
连接表的最佳 SQL 索引

考虑到性能改进我想知道哪些索引对连接表特别是在 Rails 3 has and belongs to many 上下文中使用是否有帮助以及哪些索引有帮助模型和表格设置我的模型是Foo and Bar根据 Rails 约定我有一个
JSONB 会让 PostgreSQL 数组变得无用吗？

假设您想在对象例如帖子上存储标签在 9 4 版本中您有 3 个主要选择标签作为文本标签为 jsonb 标签作为文本并且您将 JSON 字符串存储为文本在许多情况下第三个是不可能的因为它不允许对标签值进行条件查询在
谁能用适当的例子向我解释 1NF、2NF、3NF、BCNF 规则？

这是一个常见的面试问题我遇到过一次面试面试官给了我一张桌子让我告诉他这张桌子是哪种范式如果它在 NF中那么将其归一化到下一个NF 我总是对这些正常形式的数据库感到困惑谁能向我解释这些范式并举出每个 NF 如何建模到表中的正确示
标签系统：Toxi 解决方案问题

我对标签数据库模式的 Toxi 解决方案感到有点困惑我正在开发一个系统用户可以向该系统提交项目并且这些项目可以具有与其关联的标签在阅读了 tagchemas 后我发现 Toxi 解决方案最适合我的需求但是我不完全确定我的计划是
数据库优化命令

在用户可以下订单的数据库中最好有一个包含地址的新表还是每个订单的标题中都有地址数据这不仅涉及用户及其地址还涉及您所销售产品的价格和其他信息这些信息可能会发生变化after订单已下达但订单本身必须保持完整一般来说有两种方法
SQL原型设计：面对使用varchar(N)静默截断数据——有更好的选择吗？（天数据）

情况 varchar 20 好像默默地截断在 Teradata 和not当遇到长度超过 20 个字符的字符串时扩展或抱怨这有点令人惊讶因为我预计列会自动扩展以适应更大的字符串例如 30 个字符或者如果更大的字符串会抛出错误遇到字符串
博客的 mongodb 架构设计

您将如何为具有基于文档的数据库 mongodb 的类似博客的网站设计架构该站点具有以下对象用户文章评论用户可以向文章添加评论每个用户还可以为每个评论投票一次我希望能够有效地执行这些查询 1 获取文章A 文章A的评论以及每个评论
用户评级的 ER 模型

我有很多用户每个用户最多有 5 个服务用户应该能够对每项服务进行评分 0 5 我还想保留用户的平均评分这是我的想法但是还有更好的方法吗 User id user name dob 服务固定数量的服务 id service de
在数据库设计中什么时候需要使用一对一关系？

在数据库设计中什么时候需要使用一对一关系在我看来如果两个表是一对一的关系那么它们可以合并成一个表这是真的对大型表进行垂直分区以减少 I O 和缓存需求将经常查询的列与很少查询的列分开向生产系统添加列时alter table就是
在中断时获取 current->pid

我正在Linux调度程序上写一些东西我需要知道在我的中断到来之前哪个进程正在运行当前的结构可用吗如果我在中断处理程序中执行 current gt pid 我是否可以获得我中断的进程的 pid 你可以 current gt pid存在并
InnoDB 或 MyISAM - 为什么不两者都使用呢？

我读过各种关于两者之间哪个更好的主题InnoDB and MyISAM 看来争论的都是使用还是其他根据表的不同是否不能同时使用两者这样做会有什么缺点据我所知发动机可以在CREATE TABLE命令因此某些经常读取的表可以设置为
如何在Oracle数据库11g中创建新模式/新用户？

我已经申请了一家公司的实习机会作为一个问题他们要求我为他们的公司创建一个具有一定要求的架构并将DDL文件我已经安装了 Oracle 数据库 11g Express 版本但如何在 Oracle 数据库 11g 中创建新架构我在网上
如何为 apscheduler 指定“记录器”

我正在尝试学习如何使用 Python 的 apscheduler 包但它会定期抛出以下错误 No handlers could be found for logger apscheduler scheduler 该消息似乎与计划作业中的错
具有不同组合的产品和产品包的数据库模型

您将如何设计数据库来实现此功能考虑一个场景我们想要创建一个产品关系封装假设我们创建一个产品表 prod id prod name prod fee 1 prepaid A 19 usd 2 prepaid B 29 usd 3 pr
如何正确设计数据库的这一部分（循环引用？）

情况一个公司有很多项目一个项目有很多标签一个项目只属于1家公司一个标签可以属于多个项目公司必须有权访问自己的标签示例1 在第一张图片中公司的所有标签都可以通过projects project tag 获得但如果所有项目都被删除那么
如何设计具有主键和多值属性的表？

我对数据库设计很感兴趣现在正在阅读相应的文献通过这本书我遇到了一个让我感到不确定的奇怪例子有一个关系在此表中我们有一个复合主键 StudentID Activity 但ActivityFee部分依赖于表的key Activity

随机推荐

如何在IE6和7中设置CSS最大宽度？

我在我的网站中使用这个CSS代码 img max height 800px max width 600px 不幸的是它不适用于 IE 6 和 7 我该如何解决提前致谢 IE7 支持 max height 属性 http www w3sc
仅当设置了变量时才将键值对添加到数组

我将键值对添加到我的数组中如下所示 array key1 gt value1 key2 gt value2 我想添加另一个键foo 仅当变量 bar is set array key1 gt value1 key2 gt value2 f
如何在r中包含分段geom_smooth的标签？

我想标记我的geom smooth在 r 中但标签更接近实际点而不是线 Data df lt structure list t c 45 45 45 45 45 46 46 46 46 46 47 47 47 47 47 48 48 4
.net开源和运行平台选择[关闭]

Closed 此问题正在寻求书籍工具软件库等的推荐不满足堆栈溢出指南目前不接受答案我们被要求为一个大项目寻找一个完全开源的解决方案他们希望该项目尽可能接近 100 开源主要是因为它是一个社区项目未来可能没有什么可用的资金除
如何使用 C# 将 CSV 文件转换为 Parquet

我是 C 新手我想将 CSV 文件转换为 Parquet 格式我搜索了一些网站但没有得到预期的结果无论如何 C 有什么办法吗 With 辛乔 ETL 一个开源库可以将 CSV 文件转换为 Parquet 容易地安装Nuget包
powershell中定义字符串的单引号和双引号有什么区别

一直困扰我的简单问题在 powershell 中我可以像这样定义字符串 s1 Boogety boo or s2 net rocks 翻译有区别吗双引号允许变量扩展而单引号则不允许 PS C Users Administrator
文本装饰：换行在 IE 上不起作用？

我有这个 strike text decoration line through 每次我的disable 被调用它将禁用
在 Java Server Faces 中将托管属性与 CommandButton 一起使用

除了我的问题使用 Facelets 在 Java Server Faces 中创建编辑我的项目页面我想谈谈这提供的一个问题当我按下命令按钮时 ID 100 被删除并刷新页面这是Before它甚至运行该方法对吧所以这意味着当我
conda 在激活环境之外寻找库

我正在 Windows 上工作我发现 conda 创建的环境的导入行为存在差异我无法理解这里是详细信息案例一成功 base C gt conda activate
获得 C 中模 n 的最小非负留数的有效方法是什么？

有没有一种有效的方法来获得 C 中模 n 的最小非负留数其中 n 为正如果数字是非负数那么这很容易那么它只是一个 n 其中 a 是非负整数然而当 a 为负数时在 C89 中该行为似乎是实现定义的感谢 kennyTM IE
MediaWiki 会话和 cookie 无法在 CloudFlare 背后的多服务器上运行

我有一个 MediaWiki 在多个 AWS 实例上运行但登录和注册已损坏 session save path 设置为 tmp 任何人都可以写入和读取我使用 Apache2 和 PHP5 以及 MEMCACHED 每当您尝试登录时您要
使用 Linq 查询和过滤对象数组

我想这是我的一系列问题中的另一个条目但我再次陷入困境这次我在使用 JObjects 的 JArray 并确定 JArray 中每个元素的 Property Value 类型时遇到了麻烦我的代码在这里 https dotnetfidd
route('home') vs.redirect()->home()？' aria-label='何时使用：redirect('/') vs.redirect()->route('home') vs.redirect()->home()？'> 何时使用：redirect('/') vs.redirect()->route('home') vs.redirect()->home()？

当我有这个命名路线时 Route get IndexController index gt name home 然后在任意Controller的任意action方法中当我需要重定向到指定路由时home 这些语句中的任何一个都会正确重定向到
JavaScript 中的 str_shuffle() 等效项？

像str shuffle PHP中的函数是否有类似的函数在javascript中打乱字符串请帮忙不存在这样的函数你自己写一个这是一个例子 function shuffle string var parts string split
无线直连 Android

我想通过 Wi Fi Direct 在两台设备之间传输文件我想做与 WifiDirectDemo 中相同的操作但我无法将数据从组所有者传输到其他设备所以我尝试了以下操作每次其中一个设备单击连接时另一个设备就会设置为组所有者因
三元组损失的softmax版本的梯度计算

我一直在尝试在Caffe中实现softmax版本的三元组损失描述于霍弗和艾隆使用三元组网络进行深度度量学习 ICLR 2015 我已经尝试过这个但我发现很难计算梯度因为指数中的 L2 不是平方的有人可以帮我吗使用现有的 caf
CSS @font-face - “src: local('☺')”是什么意思？

我在用着 font face第一次从fontsquirrel下载了字体包他们建议插入我的 CSS 的代码是 font face font family junctionregularRegular src url Junction web
在基于 JTable 面板的单元格编辑器中丢失第一个字符

我有一个单元格编辑器其中包含一个小按钮然后是一个可用于内联编辑值的文本字段我使用 setSurrendersFocusOnKeyrinkle true 和焦点侦听器以便允许用户立即从键盘开始编辑但问题是按下的第一个键似乎被消耗而不
WPF 淡入/淡出仅运行一次

我有一个带有故事板和触发器的样式动画效果很好但只有一次我有 2 个故事板淡入和淡出在 EnterActions 中我启动 FadeIn 动画在 ExitActions 中启动 FadeOut 动画我用代码开始整个动画 TextB
优化捕获出勤数据模式的最佳方法是什么

我们有一个体育训练营该市的各个团队定期参加该训练营我们每天有一次持续 2 小时上午 9 点至 11 点的会议不同团队的时间段可能有所不同我们希望了解每天参加训练营的人员情况我们采用以下模型来捕获出席率 id user id 日

优化捕获出勤数据模式的最佳方法是什么

优化捕获出勤数据模式的最佳方法是什么 的相关文章

随机推荐

热门标签

优化捕获出勤数据模式的最佳方法是什么的相关文章