力扣刷题-面试题 17.13. 恢复空格、字典树、前缀树的应用

2023-11-15

基本概念

Trie 树

又称单词查找树、前缀树，是一种树形结构。典型应用是用于统计、排序和保存大量的字符串（但不仅限于字符串）。它的优点是：利用字符串的公共前缀来减少查询时间，最大限度地减少无谓的字符串比较，比哈希表更快。
基本性质

①．根节点不包含字符，除根节点外每个节点都只包含一个字符

②．从根节点到某一节点，路径上经过的字符连接起来，为该节点对应的字符串

③．每个节点的所有子节点包含的字符都不相同
基本操作

①．插入：把一个单词插入到字典树

②．查询前缀：判断某个单词是否为一个单词的前缀

③．查询单词：判断某个单词是否已经存在

基本原理

字典树的本质

Trie 树的本质，就是利用字符串之间的公共前缀，将重复的前缀合并在一起。
构建原理

Trie 树的插入操作就是将单词的每个字母逐一插入Trie树。插入前先判断字母对应的节点是否存在，存在则移动到下一层继续插入，不存在则创建对应的节点。

实现方法

// TrieNode 节点类，由 a-z 小写字母构成的字典树
class TrieNode
{
private:
    int count;//包含子节点数量，可以用于判断是否叶子节点
    bool isEnd;//标记是否单词结尾
    vector<TrieNode*> children;//存储子节点指针
public:
    // 构造
    TrieNode():count(0),isEnd(false),children(26,NULL) {}
    // 析构
    ~TrieNode()
    {
        for(int i = 0;i < 26;i++ )
        {
            if( children[i] ) delete children[i];
        }
    }
    // 对外系列接口
    int size() { return count ;} // 返回子节点数量
    TrieNode* insertNode(char c) // 插入一个子节点，并返回其指针
    {
        if( c  <  'a' || c > 'z' ) return NULL;
        if( children[c - 'a'] == NULL)
        {
            children[c - 'a'] = new TrieNode();
            count++;
        }
        return children[c - 'a'] ;
    }
    TrieNode* getNode( char c )//返回指定子节点
    {
        if( c  <  'a' || c > 'z' ) return NULL;
        return children[c - 'a'] ;
    }
    bool idWordEnd(){ return isEnd;}//返回是否单词结尾
    void setEnd() { isEnd = true ;}//标记本节点为单词结尾
};
// Trie 类，封装操作接口
class Trie {
private:
    TrieNode * root;//根节点
public:
    // 构造
    Trie() : root( new TrieNode() ){}
    // 析构
    ~Trie()
    {
        delete root;
    }
    // 插入一个单词
    void insert(string word) {
        TrieNode * p = root;
        for(int i = 0;i < word.size();i++ )
        {
            p = p->insertNode(word[i]);
        }
        p->setEnd() ;
    }
    //逆序插入一个单词
    void insertReverse(string word) {
        TrieNode * p = root;
        for(int i = word.size() -1;i >-1;i-- )
        {
            p = p->insertNode(word[i]);
        }
        p->setEnd() ;
    }
    //根据单词返回节点
    TrieNode *getNode(string word)
    {
        TrieNode * p = root;
        for(int i = 0;i < word.size();i++ )
        {
            p = p->getNode(word[i]) ;
            if( p == NULL ) return NULL;
        }
        return p;
    }
    // 判断指定单词是否存在
    bool search(string word) {
        TrieNode * p = getNode(word);
        if( p )
        	return  p->idWordEnd();
        return false;
    }
    //判断指定前缀是否存在
    bool startsWith(string prefix) {
        TrieNode * p = getNode(prefix);
        return p != NULL;
    }
};

字典树应用

你不小心把一个长篇文章中的空格、标点都删掉了，并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前，你得先把它断成词语。当然了，你有一本厚厚的词典dictionary，不过，有些词没在词典里。假设文章用sentence表示，设计一个算法，把文章断开，要求未识别的字符最少，返回未识别的字符数。

示例：

输入：
dictionary = [“looked”,“just”,“like”,“her”,“brother”]
sentence = “jesslookedjustliketimherbrother”
输出： 7
解释：断句后为"jess looked just like tim her brother"，共7个未识别字符。

来源：力扣（LeetCode）

题目分析

①．动态规划

定义 dp[i] 表示考虑截止到位置 i 时最少的未识别的字符数量。

为方便初始化，在字符串开头增加一个不可识别字符 “#”，则dp[0] = 1。

若存在一个位置 j 把前 i 个字符构成的子串 [0,i] 分为两部分，并且子串 [j,i] 是字典里的单词，如下图所示：

dp[i] 可以转换成 dp[j-1]，遍历找到所有的 j ,然后dp[i] 取所有 j 位置的最小值即可，所以状态转移方程为dp[i] = min(dp[i],dp[j-1]);

若不存在一个位置 j,则 dp[i] = dp[i-1] + 1。

②．字典树

用 j 在范围 [0,i] 遍历所有子串 [j,i] 时，每次都从头到尾截取子串，存在大量的重复判断，可以使用字典树进行优化：
从 j = i 开始倒叙遍历，若 [j,i] 不是字典是中的前缀，则直接中断循环即可，若 [j,i] 是字典是中的前缀,再判断是否是字典中的单词。

代码示例

class TrieNode
{
private:
    int count;//包含子节点数量，可以用于判断是否叶子节点
    bool isEnd;//标记是否单词结尾
    vector<TrieNode*> children;//存储子节点指针
public:
    // 构造
    TrieNode():count(0),isEnd(false),children(26,NULL) {}
    // 析构
    ~TrieNode()
    {
        for(int i = 0;i < 26;i++ )
        {
            if( children[i] ) delete children[i];
        }
    }
    // 对外系列接口
    int size() { return count ;} // 返回子节点数量
    TrieNode* insertNode(char c) // 插入一个子节点，并返回其指针
    {
        if( c  <  'a' || c > 'z' ) return NULL;
        if( children[c - 'a'] == NULL)
        {
            children[c - 'a'] = new TrieNode();
            count++;
        }
        return children[c - 'a'] ;
    }
    TrieNode* getNode( char c )//返回指定子节点
    {
        if( c  <  'a' || c > 'z' ) return NULL;
        return children[c - 'a'] ;
    }
    bool idWordEnd(){ return isEnd;}//返回是否单词结尾
    void setEnd() { isEnd = true ;}//标记本节点为单词结尾
};
// Trie 类，封装操作接口
class Trie {
private:
    TrieNode * root;//根节点
public:
    // 构造
    Trie() : root( new TrieNode() ){}
    // 析构
    ~Trie()
    {
        delete root;
    }
    // 插入一个单词
    void insert(string word) {
        TrieNode * p = root;
        for(int i = 0;i < word.size();i++ )
        {
            p = p->insertNode(word[i]);
        }
        p->setEnd() ;
    }
    //逆序插入一个单词
    void insertReverse(string word) {
        TrieNode * p = root;
        for(int i = word.size() -1;i >-1;i-- )
        {
            p = p->insertNode(word[i]);
        }
        p->setEnd() ;
    }
    //根据单词返回节点
    TrieNode *getNode(string word)
    {
        TrieNode * p = root;
        for(int i = 0;i < word.size();i++ )
        {
            p = p->getNode(word[i]) ;
            if( p == NULL ) return NULL;
        }
        return p;
    }
    // 判断指定单词是否存在
    bool search(string word) {
        TrieNode * p = getNode(word);
        if( p )
        	return  p->idWordEnd();
        return false;
    }
    //判断指定前缀是否存在
    bool startsWith(string prefix) {
        TrieNode * p = getNode(prefix);
        return p != NULL;
    }
    //
};
class Solution {
public:
    int respace(vector<string>& dictionary, string sentence) {
        Trie * trie = new Trie();
        for(int i = 0;i < dictionary.size();i++ )
        {
            string word = dictionary[i];
            trie->insertReverse(word);
        }
        sentence = '#'+sentence;
        vector<int> dp(sentence.size(),0);
        dp[0] = 1;
        for( int i = 1;i < sentence.size();i++)
        {
            dp[i] = dp[i-1]+1;
            string temp = "";
            for(int j = i;j > -1;j--)
            {
                temp += sentence[j] ;
                TrieNode * p = trie->getNode(temp);
                if( p  ) //是后缀
                {
                    if( p->idWordEnd() )
                        dp[i] = min(dp[i],dp[j-1]);
                }
                else
                {
                    break;
                }
            }
        }
        return dp[sentence.size()-1] -1 ;
    }
};

在这里插入图片描述

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

算法与数据结构

力扣刷题

字典树

LeetCode

c

力扣刷题-面试题 17.13. 恢复空格、字典树、前缀树的应用的相关文章

do { ... } while (0) — 它有什么用？ [复制]

这个问题在这里已经有答案了我已经看到这个表情十多年了我一直在努力思考它有什么好处因为我主要在 defines 中看到它所以我认为它对于内部作用域变量声明和使用中断而不是 gotos 很有用对其他方面有好处吗你用它吗这是 C
编译错误：尝试在函数调用中指定参数类型时出现“预期在 ' ' 之前出现主表达式”

当我编译我的程序时我收到以下错误消息 stringPerm cpp In function int main stringPerm cpp 12 error expected primary expression before word
从变量使用 OLE DB 源命令的 EzAPI 等效项是什么？

tl dr 使用来自变量的 SQL 命令数据访问模式的 OLE DB 源并分配变量的 EzAPI 代码是什么 Preamble 每月一次我们需要使用生产数据的子集刷新我们的公共测试站点我们已确定根据我们的需求 SSIS 解决方案最
从值获取键 - Dictionary>

我无法通过指定值来获取密钥我实现这一目标的最佳方法是什么 var st1 new List
未定义的参考错误 - rand

我正在创建一个命令行 C 测试应用程序可执行以便在我的 root Android 设备上运行该可执行文件使用多个预构建的 C 库其中之一使用 rand 在链接状态期间我收到错误 rand 的未定义引用为了检查路径是否设置正确我尝
在 Linux 上，在 Eclipse CDT 中使用 gdb 调试 C++ 应用程序，如何向 stdin 输入内容？

在 Linux 上我尝试在 Eclipse CDT 中使用 gdb 调试 C 应用程序例如应用程序applic exe接受一些命令行参数arg1 and arg2它期望一些数据stdin 比如说取自文件input txt 通常要在控
如何直观理解C++优先级队列容器比较器中的大于/小于运算符

我总是对为优先级队列容器定义比较器感到困惑并且不知道如何理解它例如我有一个vector of pair
send() 使我的程序崩溃

我正在运行服务器和客户端我正在我的计算机上测试我的程序这是服务器中向客户端发送数据的函数 int sendToClient int fd string msg cout lt lt sending to client lt lt fd
重写 ASP.Net Core 中的 415 响应

在 ASP net Core 2 1 中我想返回 Json 响应以及状态代码 415 而不是默认返回的 415 为了实现这一点我使用资源过滤器 public class MediaTypeResouceFilter Attribute
Err_Response_Headers_Multiple_Content_Disposition

我需要导出 2csv单击一个按钮即可打开文件下面是我生成2的代码csv files using System Data using System Data SqlClient using System Text using System
C# 如何在没有 GacUtil 的情况下在 GAC 中注册程序集？

我需要使用批处理文件在 GAC 中注册程序集有没有办法找到安装位置GacUtil exe或者有没有办法在没有 GacUtil 的情况下注册程序集 Your bestbet is to use a powershell script tha
Time 方法在另一个线程中执行并在超时时中止

您好我正在尝试异步运行方法以便计算持续时间并在超过超时时取消该方法我尝试使用异步和等待来实现这一点但没有运气也许我过度设计了这个任何输入都会受到赞赏应该注意的是我无法更改接口 TheirInterface 因此得名到目前为
了解C/C++中函数调用的堆栈框架？ [关闭]

很难说出这里问的是什么这个问题是含糊的模糊的不完整的过于宽泛的或修辞性的无法以目前的形式得到合理的回答如需帮助澄清此问题以便重新打开访问帮助中心 help reopen questions 我也是 C C 和汇编语言的新手这
allocator.construct 循环是否等于 std::uninitialized_copy？

在此背景下T是某种类型并且allocator是该类型的分配器对象默认情况下是std allocator
我如何错误地使用 C 中的 round() 函数？

我从中得到了意想不到的结果round and roundf 中的函数math h图书馆这是示例代码 include
NHibernate Criteria API 是否支持集合属性的投影？

我需要使用条件 API 复制以下工作 HQL 查询 session CreateQuery select c from Parent p inner join p Children c where p Id 9 and c Id 33 Se
解析 SWIG 接口文件的结构属性

这是我不久前问过的问题的延续为通过参数返回的函数创建类型映射 https stackoverflow com questions 12793973 create a typemap for a function that returns
在一个数据库请求中连接 IQueryable 集合

我使用实体框架我需要连接两个集合例如 IQueryable
实体框架中对象属性中的 NULL 值

Tables Article Author Comment 1篇文章和1位作者可以有评论数据库中有 1 篇文章 1 位作者和 1 条评论问题是该代码 myBD my bd new myBD var articles by bd Ar
在 Rx 中，如何按 id 对事件进行分组并按多个时间跨度限制每个组？

可以这么说我陷入了 Rx 热潮这个问题与我的相关here https stackoverflow com questions 19425965 rx how to group by a key a complex object and

随机推荐

HDU - 1020 Encoding

Given a string containing only A Z we could encode it using the following method Each sub string containing k same chara
IDEA 安装插件IDE Eval Reset

IDE Eval Reset是什么 idea eval reset是Jetbrains的插件官方良心产品会允许我们试用30天可以借此重新刷新idea正版程序的使用期限哈哈哈爽到没朋友具体操作 1 点击intelliJ IDEA
[开源协议]58种开源协议及分类

转载自 http www opensource org licenses alphabetical 更多关于具体协议内容请看其链接 Licenses that are popular and widely used or with stro
Linux、Ubuntu下安装yaml, 关于Import Error: No module named yaml

pip install pyyaml 如果不行的话就 conda install yaml 最后 gt gt gt import yaml 没有报错就成功了
mingw64镜像网站

mingw64镜像网站 http files 1f0 de mingw
UIBOT的简单使用

最近项目上使用到一个新的技术软件刚一阶段使用结束用来记录下首先我们了解下UIbot 这里我直接放上下载社区版本的官方地址来也科技RPA AI智能自动化平台助力政企实现智能时代的人机协同首先需要用邮箱注册然后直接安装社区版本这
【毕设教程】FCM模糊聚类算法

文章目录 0 前言 1 如何理解模糊聚类 2 模糊C means聚类算法 3 FCM算法原理 4 Python FCM支持 4 1 安装相关库 4 2 skfuzzy cmeans函数说明 4 3 代码实现 4 4 运行结果 5 FCM算法
C++stringstream的简单介绍以及使用

在C语言中如果想要将一个整形变量的数据转化为字符串格式可以使用以下两种方式 1 itoa 函数 2sprint 函数但是两个函数在转化时都得需要先给出保存结果的空间那空间要给多大呢就不太好界定而且转化格式不匹配时可能还会得到错
matlab打开视频文件并提取颜色数据

目标实现加载任意视频文件并按帧取指定图像区域的某颜色值代表该区域的颜色值 1 加载视频文件加载视频文件使用函数VideoReader 输入为文件夹路径返回为一个VideoReader对象具体使用方法见创建对象以读取视频文件 MAT
离散数学主析取范式及主合取范式

今天总结了一下关于离散数学化简主析取范式以及主合取范式的一些方法首先一般可能会用到分配律 A B C lt gt A B A C A B C lt gt A B A C 其次若化简式里有蕴涵符号则可以用蕴涵等值式 A B lt gt
数据清洗、数据挖掘常见十大问题

数据清洗数据挖掘常见十大问题一数据预处理数据清洗和特征工程二数据预处理和特征工程阶段最常见的10个问题 1 什么是数据 EDA 2 缺失值的处理方式有哪些 3 如何检测异常数据如何处理 4 什么是特征工程有什么作用 5 特
【Spring】数据导出为Excel的接口报java.io.IOException: UT010029: Stream is closed错误

数据导出为Excel的接口报java io IOException UT010029 Stream is closed错误实习时导师让写一个平台信息导出为Excel的功能写完之后发现文件正常导出但控制台一直报Stream is clo
react中使用less和全局样式

前言使用create react app脚手架搭建的react项目会自带css和sass 但是没有less 如果在项目中需要使用less 需要进行下载并进行一些配置 1 配置 1 暴露webpack配置文件 create react a
解决 in ./node_modules/cesium/Source/ThirdParty/zip.js报错

由于在 node modules cesium Source ThirdParty zip js 文件中使用了 import meta 语法 webpack 默认不支持在进行项目构建时会报如下错误提示信息需要添加 loader 接下来
谷歌浏览器配置微信浏览器_使用Chrome修改user agent模拟微信内置浏览器

很多时候我们需要模拟微信内置浏览器今天教大家用chrome简单模拟如图设置 F12或者右键审查元素进入开发者模式点击Emulation 然后点击Network 把Spoof user agent改成Other 并把下面的带复制进去
PaddleSpeech调研、安装、使用

PaddleSpeech概述 PaddleSpeech asr 模块目前只支持中英文的语音自动识别建议在Linux环境下安装和使用配置环境要求 gcc gt 4 8 5 paddlepaddle gt 2 4 1 python gt 3
概率论与数理统计

目录一概率论的基本概念 1 1 概率论的直观解释和数学定义 1 2 条件概率与乘法公式 1 3 全概率公式与贝叶斯公式 1 4 事件的独立性二随机变量与分布函数 2 1 随机变量与分布函数 2 2 离散型随机变量和常用分布 2 3
定时任务——Cron表达式详解

Cron表达式是一个字符串字符串以5或6个空格隔开分为6或7个域每一个域代表一个含义 Cron有如下两种语法格式 Seconds Minutes Hours DayofMonth Month DayofWeek Year或 Secon
C++ : 在一个string字符串中查找给定的字符串并提取

C 在一个string字符串中查找给定的字符串并提取 1 string find last of 返回类型 size t 2 string find first of 返回类型 size t 3 string substr size t a
力扣刷题-面试题 17.13. 恢复空格、字典树、前缀树的应用

基本概念 Trie 树又称单词查找树前缀树是一种树形结构典型应用是用于统计排序和保存大量的字符串但不仅限于字符串它的优点是利用字符串的公共前缀来减少查询时间最大限度地减少无谓的字符串比较比哈希表更快基本性质根节点不包

力扣刷题-面试题 17.13. 恢复空格、字典树、前缀树的应用

基本概念

基本原理

实现方法

字典树应用

力扣刷题-面试题 17.13. 恢复空格、字典树、前缀树的应用 的相关文章

随机推荐

热门标签

力扣刷题-面试题 17.13. 恢复空格、字典树、前缀树的应用的相关文章