SQL地址数据很乱,如何在查询中清理它?

2023-11-20

我的地址数据存储在 SQL Server 2000 数据库中,我需要提取给定客户代码的所有地址。问题是,有很多拼写错误的地址,有些缺少部分等等。所以我需要以某种方式清理它。我需要剔除错误的拼写、缺失的部分等,并得出“平均”记录。例如,如果 New York 在 5 条记录中有 4 条拼写正确,则该值应该是返回的值。

我无法修改数据、验证输入数据或类似的事情。我只能修改数据的副本,或通过查询对其进行操作。

我在这里得到了部分答案SQL Server 中存储的地址有许多小变化(错误),但我需要允许每个代码有多个有效地址。

样本数据



Code    Name                       Address1                      Address2           City            State          Zip     TimesUsed
10003   AMERICAN NUTRITON INC     2183 BALL STREET                                 OLDEN           Utah           87401     177
10003   AMEICAN NUTRITION INC     2183 BALL STREET              PO BOX 1504        OLDEN           Utah           87402     76
10003   AMERICAN NUTRITION INC    2183 BALL STREET                                 OLDEN           Utah           87402     24
10003   AMERICAN NUTRITION INC    2183 BALL STREET              PO BOX 1504        OLDEN           Utah           87402     17
10003   Samantha Brooks           506 S. Main Street                               Ellensburg      Washington     98296     1
10003   BEMIS COMPANY             1401 W. FOURTH PLAIN BLVD.                       VANCOUVER       Washington     98660     1
10003   CEI                       597 VANDYRE BOULEVARD                            WRIGHTSTOWN     Wisconsin      54180     1
10003   Pacific Pet               28th Avenue                                      OLDEN           Utah           84401     1
10003   PETSMART, INC.            16091 NORTH 25TH STREET                          PHOENA         Arizona        85027      1
10003   THE PET FIRM              16418 NORTH 37TH STREET                          PHOENA         Arizona        85503      1
  

所需输出



Code    Name                      Address1                      Address2           City            State          Zip     
10003   AMERICAN NUTRITION INC    2183 BALL AVENUE                                 Olden           Utah           84401
10003   Samantha Brooks             506 S. Main Street                               Ellensburg      Washington     98296 
10003   BEMIS COMPANY             1401 W. FOURTH PLAIN BLVD.                       VANCOUVER       Washington     98660
10003   CEI                       975 VANDYKE ROAD                                 WRIGHTSTOWN     Wisconsin      54180
10003   Pacific Pet               29th Street                                      OGDEN           Utah           84401
10003   PETSMART, INC.            16091 NORTH 25TH AVENUE                          PHOENA         Arizona        85027
10003   THE PET FIRM              16418 NORTH 37TH STREET                          PHOENA         Arizona        85503
  

最好的解决方案是使用 CASS 认证的地址标准化程序或服务来格式化和验证地址。除了拥有这方面工具的 USPS 之外,还有许多第三方程序或服务提供此功能。地址解析比您想象的要复杂得多,因此尝试发起一些查询来完成它将会充满危险。

谷歌的地理编码是另一个值得一看的地方。。显然,谷歌要求您显示结果才能使用他们的地理编码服务。这就需要使用专用的地址解析器,例如 USPS 或第三方程序。

本文内容由网友自发贡献,版权归原作者所有,本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容,请联系:hwhale#tublm.com(使用前将#替换为@)

SQL地址数据很乱,如何在查询中清理它? 的相关文章

  • SSIS Master 包执行来自另一个项目的包

    我有多个SSIS项目 但其中的一些包是相同的 我想创建一个包含所有内容的项目generic包并将其他项目与他们的特定包一起保存 所以我的问题是 是否有可能有一个主包可以执行并将父变量传递给另一个项目的包 我是 SSIS 新手 如果这是一个明
  • 随机排列每行的列值

    我正在使用 C NET 开发多项选择题考试生成器 每次做出报告时 都会在数据库中随机挑选问题 并随机调整选项 我可以做随机问题部分 但我不能做选择的洗牌 我有一张表 其中一行如下 question answer distractor1 di
  • 为什么 SSRS 报表从 SQL Server Reporting Services 运行时生成的数据与使用“预览”选项卡运行时生成的数据不同?

    我有一个运行我想要的数据的报表 从 预览 选项卡 即 或者在 VS 2010 中使用 F5 运行时 但是当我将报表 rdl 文件 上传到 SQL Server Reporting Services 并运行更新后的报表时从那里报告 它仍然显示
  • sql脚本变量默认值

    我有一个脚本文件 例如测试 sql 我想从另一个脚本调用它 比如 caller sql 在 sqlcmd 模式下使用 r test sql 这工作正常 但我想在 test sql 中使用脚本变量 当我从 caller sql 调用 test
  • Lucene.Net 下划线导致令牌分裂

    我已将 MsSqlServer 数据库表 视图和存储过程编写到目录结构中 然后使用 Lucene net 对其进行索引 我的大多数表 视图和过程名称都包含下划线 我使用标准分析器 如果我查询名为 tIr 的表例如 发票 tnWtn01 我收
  • 如何使用 PHP 从 MSSQL 读取图像字段

    我正在创建一个网站 需要同步从离线 MSSQL 服务器读取的在线 MySQL 数据库 除图像字段外 所有通信和从 MSSQL 读取所有字段均工作正常 我已经使用 PHP 和 Mysql 一段时间了 知道如何向 MySQL 数据库插入 检索图
  • SQL Server 之间

    我有一个表 其中有年 月和一些数字列 Year Month Total 2011 10 100 2011 11 150 2011 12 100 2012 01 50 2012 02 200 现在 我想要SELECT2011 年 11 月至
  • 如何通过Object Id和Column Id查询表数据?

    有桌子Clients PK LastName Name Address 1 Vidal Arturo St 2 Lavezzi Ezequiel St 3 Cuadrado Guillermo St 我想得到 通过以下查询 我可以得到前四列
  • 数据结构的优化存储以实现快速查找和持久化

    Scenario 我有以下方法 public void AddItemSecurity int itemId int userIds public int GetValidItemIds int userId 最初我正在考虑表单上的存储 i
  • 仅从数据库获取我想要的数据但保留结构

    我正在尝试在 powerbi 上执行此操作 但我想这只是基本的 SQL 我想将我的数据导入到 powerBi 中 但使用一些 id 对其进行过滤 我们以这个例子为例 我与一些公司有数据库 表1 每个公司都有建筑物 表2 每个建筑物有员工 表
  • 如何找到在SQL Server中注册的程序集?

    我在 SQL Server 中注册了一个程序集 CREATE ASSEMBLY CLRFunctions AUTHORIZATION dbo FROM 0x4D5A90000300000 WITH PERMISSION SET SAFE 我
  • 为什么某些字符无法从 CFQUERY 正确注入到 SQL Server?

    我有一个在 Lucee 上运行的 Coldfusion 应用程序 它连接到 SQL Server 数据库 当我直接在 SQL Server 管理器中运行以下查询时 UPDATE article SET content 20m WHERE i
  • 如何在SQL Server数据库表列中存储图像[重复]

    这个问题在这里已经有答案了 我有一张名为FEMALE在我的数据库中 它有ID as Primary Key 它有一个Image column 我的问题是如何使用 SQL 查询存储图像 尝试一下 insert into tableName I
  • 在单个更新语句上使用事务

    我在工作中为一些 SP 配音 我发现编写代码的人在单个更新语句上使用了事务 如下所示 begin transaction single update statment update table whatever with whatever
  • t sql中的相对路径?

    如何获取t sql中的相对路径 举个例子 sql文件位于文件夹中D temp 我想获取文件夹中文件hello txt的路径D temp App Data 如何使用相对路径引用 假设我正在 SQL Server Management Stud
  • (SQL) 识别字段中字符串格式多次出现的位置

    我需要将叙述字段 自由文本 拆分为多行 目前的格式如下 Case Reference Narrative XXXX XX 123456 Endless Text up to 50k characters 在作为文本的叙述字段中 各个条目 当
  • 如何在 SQL Server 中什么都不做[重复]

    这个问题在这里已经有答案了 可能的重复 T SQL 中的空语句 https stackoverflow com questions 3234871 empty statement in t sql 我怎样才能让它在 SQL Server 中
  • SQL Server 中的动态透视多列

    我有一张这样的桌子 Id Name FromAddress ToAddress 1 Joey ABC JKL 2 Joey DEF MNP 3 Joey GHI OQR 我正在 SQL Server 中寻找带有动态数据透视表的以下输出 Na
  • 是否可以执行具有输出参数的 T-SQL 存储过程,同时忽略 SELECT 语句?

    我正在从另一个存储过程调用一个存储过程 并且我调用的过程有一个输出参数 然后我将输出值传输到局部变量中 这一切都很好 但问题是这个过程还有一个select其中的声明 所以当我exec 该过程的结果将在最终结果集中返回 有没有一种方法可以简单
  • Spring Boot MSSQL Kerberos 身份验证

    目前在我的春季靴子中application properties文件中 我指定以下行来连接到 MSSql 服务器 spring datasource url jdbc sqlserver localhost databaseName spr

随机推荐

  • 在控制器之间设置和检索对象的 Angular 服务

    我一直在尝试从 http post 响应设置一个服务对象到一个控制器并从另一个控制器获取它 我在 SO 或网站中看到的教程更多地侧重于将其从 HTML 输入获取到控制器 然后另一个控制器获取值 我想避免使用 rootscope 而且我是 a
  • 如何在64位Window下连接R与Access数据库?

    当我尝试将 R 与 Access 数据库连接时出现错误 odbcConnectAccess is only usable with 32 bit Windows 有谁知道如何解决这个问题 library RODBC mdbConnect l
  • OpenCVSharp:无法加载 DLL“OpenCvSharpExtern”

    我已经在我的项目中使用 NuGet 管理器安装了最新的 OpenCVSharp 2 2 4 10 201 有关 OpenCVSharp CvMat 的所有内容都工作正常 加载 操作等 因此我确信安装是正确的 但是我根本无法使用 OpenCV
  • iPhone 6 显示缩放功能扰乱了整个视图

    我在使用 iPhone 6 时遇到问题显示缩放功能 如 Xcode 6 1 1 模拟器没有显示缩放功能来测试 并且仅具有标准显示 Problem 当我在模拟器和 iPhone6 带标准显示 上运行代码时 它工作正常 但是当我在 iPhone
  • 如何减少新表单的“使用”样板?

    每次我向项目中添加新表单时 都会在使用条款中删除一大堆样板文件 uses Windows Messages SysUtils Variants Classes Graphics Controls Forms Dialogs 说真的 谁会定期
  • npm 在哪里安装包?

    有人可以告诉我在哪里可以找到我使用安装的 Node js 模块吗npm 全球图书馆 你可以运行npm list g查看安装了哪些全局库以及它们所在的位置 使用npm list g head 1对于仅显示路径的截断输出 如果您只想显示主包而不
  • p.classname 或 .classname p,有什么区别吗?

    所以 我对这个简单的事情有点困惑 我已经尽可能多地用谷歌搜索 但我只是不知道谷歌搜索的正确关键字 我尝试了 CSS 选择器等 没有答案足以消除我的困惑 所以我也测试过 p classname似乎不起作用 但根据我正在读的书中的定义 2012
  • 如何计算R中矩阵乘积的对角线

    我有两个矩阵A and B 那么最快的方法是什么just计算diag A B 即内积ith row of A and ith的列B and 不关心其他项的内积 补充 A and B分别具有较大的行数和列数 这可以在不进行完整矩阵乘法的情况下
  • WPF 中 MDI 的替代方案?

    希望这是一个合适的问题 我第一次使用 WPF 最终目标是将我们的程序从 winforms 应用程序转换为 WPF 应用程序 我们的应用程序当前使用 MDI 表单作为主表单 以允许打开多个窗口来显示数据等 在 WPF 中 显示多组数据的最佳实
  • pkill 通过远程 ssh 与另一个命令结合返回 255

    当我尝试在远程主机上结合另一个命令执行 pkill 时 它总是返回 255 即使这两个命令都成功 Examples ssh
  • 如何在 R 中创建显示预测模型、数据和残差的图表

    给定两个变量 x and y 我对变量运行动态回归 并希望根据其中一个变量绘制拟合模型 并在底部显示实际数据线与预测线的残差 以显示实际数据线的差异 我以前见过它 我以前也做过 但我一生都不记得如何做或找到任何解释它的东西 这让我陷入了困境
  • R doParallel 进度条来监控已完成的作业

    我正在尝试编写一个具有多线程功能的 CRAN 包 我得到了一个完美的解决方案doSNOW 但该软件包已被 CRAN 团队标记为 取代 他们要求我切换到doParallel解决方案 这很好 但是我找不到一种方法来监控使用完成的作业数量doPa
  • Rails ActiveStorage url_for 返回无效的 URL

    我有一个带有头像的员工模型 我可以将图像附加到头像 但每当我尝试显示图像时 url for employee avatar 产生死链接 我所看到的只是来自的价值alt来自标签的属性 我得到的图像标签如下 img src rails acti
  • 您可以在不使用相对路径的情况下从 css 引用图像吗?

    我想创建一个带有背景图像CSS的div mydiv background image url public images foo png background repeat repeat x 现在 我无法在 css 中使用路由 因此我必须使
  • 如何将“wchar_t *”转换为“const char *”

    我怎样才能转换 wchar t to const char 使用C MFC VS2010 谢谢 由于问题是关于MFC的 我建议如下 CStringA a Test CStringW w L Test a CStringA w w CStri
  • ClassLoader 不提供“addTransformer(ClassFileTransformer)”方法

    我正在使用 Spring 和 AspectJ 进行一些不错的编织 插入后我刚刚遇到了这个问题
  • 阻止或取消退出 JavaFX 2

    当退出 JavaFX 程序时 我将重写 Application stop 以检查未保存的更改 这工作正常 但最好为用户提供取消操作的选项 换句话说 Application stop 是最后机会沙龙 虽然它确实捕获了退出 但撤销退出过程有点晚
  • 无法从 ondatachange 方法获取值

    我目前正在开发一个android应用程序 我使用firebase作为数据库 但是当我在onDataChange方法中获取变量并将它们分配给全局变量时 我得到了空变量 但是当我在onDataChange方法中调用这些变量时 它们是不为空 pu
  • 如何在 Typescript 中定义类数组(而不是实例)

    我正在尝试 Typescript 中的一些语言结构 我希望创建一个类数组 稍后将实例化这些类 如果我在上面尝试的话 我的代码似乎可以编译并且可以工作打字稿游乐场但它确实在打字稿框中给出了错误 Argument of type typeof
  • SQL地址数据很乱,如何在查询中清理它?

    我的地址数据存储在 SQL Server 2000 数据库中 我需要提取给定客户代码的所有地址 问题是 有很多拼写错误的地址 有些缺少部分等等 所以我需要以某种方式清理它 我需要剔除错误的拼写 缺失的部分等 并得出 平均 记录 例如 如果