pycosat中慢速dnf到cnf

2024-02-24

问题简述

有一个适当的输入pycosat https://pypi.org/project/pycosat/，有没有办法加速从dnf到cnf的计算，或者完全绕过它？

详细问题

我一直在看这个视频 https://www.youtube.com/watch?v=_GP9OpZPUYcRaymond Hettinger 关于现代求解器的内容。我下载了代码，并为游戏实现了一个求解器Towers https://www.chiark.greenend.org.uk/%7Esgtatham/puzzles/js/towers.html在里面。下面我分享了这样做的代码。

塔谜题示例（已解决）：

    3 3 2 1    
---------------
3 | 2 1 3 4 | 1
3 | 1 3 4 2 | 2
2 | 3 4 2 1 | 3
1 | 4 2 1 3 | 2
---------------
    1 2 3 2

我遇到的问题是从 dnf 到 cnf 的转换需要很长时间。假设您知道从某个视线可以看到 3 座塔。这导致该行中有 35 种可能的排列 1-5。

[('AA 1', 'AB 2', 'AC 5', 'AD 3', 'AE 4'),
 ('AA 1', 'AB 2', 'AC 5', 'AD 4', 'AE 3'),
 ...
 ('AA 3', 'AB 4', 'AC 5', 'AD 1', 'AE 2'),
 ('AA 3', 'AB 4', 'AC 5', 'AD 2', 'AE 1')]

这是一个析取范式：多个 AND 语句的 OR。这需要转换为连接范式：多个 OR 语句的 AND。然而，这非常慢。在我的 Macbook Pro 上，它在 5 分钟后没有完成单行的 cnf 计算。对于整个拼图，此操作最多应完成 20 次（对于 5x5 网格）。

为了使计算机能够解决这个塔谜题，优化这段代码的最佳方法是什么？

此代码也可从这个 Github 存储库 https://github.com/physicalattraction/solvers.

import string

import itertools
from sys import intern
from typing import Collection, Dict, List

from sat_utils import basic_fact, from_dnf, one_of, solve_one

Point = str


def comb(point: Point, value: int) -> str:
    """
    Format a fact (a value assigned to a given point), and store it into the interned strings table

    :param point: Point on the grid, characterized by two letters, e.g. AB
    :param value: Value of the cell on that point, e.g. 2
    :return: Fact string 'AB 2'
    """

    return intern(f'{point} {value}')


def visible_from_line(line: Collection[int], reverse: bool = False) -> int:
    """
    Return how many towers are visible from the given line

    >>> visible_from_line([1, 2, 3, 4])
    4
    >>> visible_from_line([1, 4, 3, 2])
    2
    """

    visible = 0
    highest_seen = 0
    for number in reversed(line) if reverse else line:
        if number > highest_seen:
            visible += 1
            highest_seen = number
    return visible


class TowersPuzzle:
    def __init__(self):
        self.visible_from_top = [3, 3, 2, 1]
        self.visible_from_bottom = [1, 2, 3, 2]
        self.visible_from_left = [3, 3, 2, 1]
        self.visible_from_right = [1, 2, 3, 2]
        self.given_numbers = {'AC': 3}

        # self.visible_from_top = [3, 2, 1, 4, 2]
        # self.visible_from_bottom = [2, 2, 4, 1, 2]
        # self.visible_from_left = [3, 2, 3, 1, 3]
        # self.visible_from_right = [2, 2, 1, 3, 2]

        self._cnf = None
        self._solution = None

    def display_puzzle(self):
        print('*** Puzzle ***')
        self._display(self.given_numbers)

    def display_solution(self):
        print('*** Solution ***')
        point_to_value = {point: value for point, value in [fact.split() for fact in self.solution]}
        self._display(point_to_value)

    @property
    def n(self) -> int:
        """
        :return: Size of the grid
        """

        return len(self.visible_from_top)

    @property
    def points(self) -> List[Point]:
        return [''.join(letters) for letters in itertools.product(string.ascii_uppercase[:self.n], repeat=2)]

    @property
    def rows(self) -> List[List[Point]]:
        """
        :return: Points, grouped per row
        """

        return [self.points[i:i + self.n] for i in range(0, self.n * self.n, self.n)]

    @property
    def cols(self) -> List[List[Point]]:
        """
        :return: Points, grouped per column
        """

        return [self.points[i::self.n] for i in range(self.n)]

    @property
    def values(self) -> List[int]:
        return list(range(1, self.n + 1))

    @property
    def cnf(self):
        if self._cnf is None:
            cnf = []

            # Each point assigned exactly one value
            for point in self.points:
                cnf += one_of(comb(point, value) for value in self.values)

            # Each value gets assigned to exactly one point in each row
            for row in self.rows:
                for value in self.values:
                    cnf += one_of(comb(point, value) for point in row)

            # Each value gets assigned to exactly one point in each col
            for col in self.cols:
                for value in self.values:
                    cnf += one_of(comb(point, value) for point in col)

            # Set visible from left
            if self.visible_from_left:
                for index, row in enumerate(self.rows):
                    target_visible = self.visible_from_left[index]
                    if not target_visible:
                        continue
                    possible_perms = []
                    for perm in itertools.permutations(range(1, self.n + 1)):
                        if visible_from_line(perm) == target_visible:
                            possible_perms.append(tuple(
                                comb(point, value)
                                for point, value in zip(row, perm)
                            ))
                    cnf += from_dnf(possible_perms)

            # Set visible from right
            if self.visible_from_right:
                for index, row in enumerate(self.rows):
                    target_visible = self.visible_from_right[index]
                    if not target_visible:
                        continue
                    possible_perms = []
                    for perm in itertools.permutations(range(1, self.n + 1)):
                        if visible_from_line(perm, reverse=True) == target_visible:
                            possible_perms.append(tuple(
                                comb(point, value)
                                for point, value in zip(row, perm)
                            ))
                    cnf += from_dnf(possible_perms)

            # Set visible from top
            if self.visible_from_top:
                for index, col in enumerate(self.cols):
                    target_visible = self.visible_from_top[index]
                    if not target_visible:
                        continue
                    possible_perms = []
                    for perm in itertools.permutations(range(1, self.n + 1)):
                        if visible_from_line(perm) == target_visible:
                            possible_perms.append(tuple(
                                comb(point, value)
                                for point, value in zip(col, perm)
                            ))
                    cnf += from_dnf(possible_perms)

            # Set visible from bottom
            if self.visible_from_bottom:
                for index, col in enumerate(self.cols):
                    target_visible = self.visible_from_bottom[index]
                    if not target_visible:
                        continue
                    possible_perms = []
                    for perm in itertools.permutations(range(1, self.n + 1)):
                        if visible_from_line(perm, reverse=True) == target_visible:
                            possible_perms.append(tuple(
                                comb(point, value)
                                for point, value in zip(col, perm)
                            ))
                    cnf += from_dnf(possible_perms)

            # Set given numbers
            for point, value in self.given_numbers.items():
                cnf += basic_fact(comb(point, value))

            self._cnf = cnf

        return self._cnf

    @property
    def solution(self):
        if self._solution is None:
            self._solution = solve_one(self.cnf)
        return self._solution

    def _display(self, facts: Dict[Point, int]):
        top_line = '    ' + ' '.join([str(elem) if elem else ' ' for elem in self.visible_from_top]) + '    '
        print(top_line)
        print('-' * len(top_line))
        for index, row in enumerate(self.rows):
            elems = [str(self.visible_from_left[index]) or ' ', '|'] + \
                    [str(facts.get(point, ' ')) for point in row] + \
                    ['|', str(self.visible_from_right[index]) or ' ']
            print(' '.join(elems))
        print('-' * len(top_line))
        bottom_line = '    ' + ' '.join([str(elem) if elem else ' ' for elem in self.visible_from_bottom]) + '    '
        print(bottom_line)
        print()


if __name__ == '__main__':
    puzzle = TowersPuzzle()
    puzzle.display_puzzle()
    puzzle.display_solution()

实际时间花费在该辅助函数中，来自视频附带的使用的辅助代码。

def from_dnf(groups) -> 'cnf':
    'Convert from or-of-ands to and-of-ors'
    cnf = {frozenset()}
    for group_index, group in enumerate(groups, start=1):
        print(f'Group {group_index}/{len(groups)}')
        nl = {frozenset([literal]): neg(literal) for literal in group}
        # The "clause | literal" prevents dup lits: {x, x, y} -> {x, y}
        # The nl check skips over identities: {x, ~x, y} -> True
        cnf = {clause | literal for literal in nl for clause in cnf
               if nl[literal] not in clause}
        # The sc check removes clauses with superfluous terms:
        #     {{x}, {x, z}, {y, z}} -> {{x}, {y, z}}
        # Should this be left until the end?
        sc = min(cnf, key=len)  # XXX not deterministic
        cnf -= {clause for clause in cnf if clause > sc}
    return list(map(tuple, cnf))

输出来自pyinstrument当使用 4x4 网格时显示该行cnf = { ... }罪魁祸首在这里：

  _     ._   __/__   _ _  _  _ _/_   Recorded: 21:05:58  Samples:  146
 /_//_/// /_\ / //_// / //_'/ //     Duration: 0.515     CPU time: 0.506
/   _/                      v3.4.2

Program: ./src/towers.py

0.515 <module>  ../<string>:1
   [7 frames hidden]  .., runpy
      0.513 _run_code  runpy.py:62
      └─ 0.513 <module>  towers.py:1
         ├─ 0.501 display_solution  towers.py:64
         │  └─ 0.501 solution  towers.py:188
         │     ├─ 0.408 cnf  towers.py:101
         │     │  ├─ 0.397 from_dnf  sat_utils.py:65
         │     │  │  ├─ 0.329 <setcomp>  sat_utils.py:73
         │     │  │  ├─ 0.029 [self]
         │     │  │  ├─ 0.021 min  ../<built-in>:0
         │     │  │  │     [2 frames hidden]  ..
         │     │  │  └─ 0.016 <setcomp>  sat_utils.py:79
         │     │  └─ 0.009 [self]
         │     └─ 0.093 solve_one  sat_utils.py:53
         │        └─ 0.091 itersolve  sat_utils.py:43
         │           ├─ 0.064 translate  sat_utils.py:32
         │           │  ├─ 0.049 <listcomp>  sat_utils.py:39
         │           │  │  ├─ 0.028 [self]
         │           │  │  └─ 0.021 <listcomp>  sat_utils.py:39
         │           │  └─ 0.015 make_translate  sat_utils.py:12
         │           └─ 0.024 itersolve  ../<built-in>:0
         │                 [2 frames hidden]  ..
         └─ 0.009 <module>  typing.py:1
               [26 frames hidden]  typing, abc, ..

首先，最好注意等价性和等可满足性之间的区别。一般来说，将任意布尔公式（例如 DNF 中的某些公式）转换为 CNF 可能会导致大小呈指数级增长。

这次爆炸是你的问题from_dnf方法：每当你处理另一个产品术语时，each该产品中的文字需要当前 cnf 子句集的新副本（它将在每个子句中添加自己）。如果您有 n 个大小为 k 的乘积项，则增长为O(k^n).

在你的情况下n实际上是一个函数k!。保留为乘积项的内容将被过滤为满足视图约束的内容，但总体而言，程序的运行时间大致在O(k^f(k!))。即使 f 按对数增长，这仍然是O(k^(k lg k))而且不太理想！

因为你问“这是可以满足的吗？”，所以你不需要相等的公式但仅仅是一个可同等满足的一。这是一些新公式，当且仅当原始公式是可满足的时，它是可满足的，但相同的分配可能无法满足该公式。

例如，(a ∨ b) and (a ∨ c) ∧ (¬b)显然每个都是可满足的，因此它们是可等满足的。但设置btrue 满足第一个，而 false 满足第二个，因此它们不等价。此外，第一个甚至没有c作为一个变量，再次使其不等于第二个。

这种放松足以用linear大小的翻译代替。

关键的想法是使用扩展变量。这些是新变量（即，公式中尚未存在），允许我们缩写表达式，因此我们最终不会在翻译中制作它们的多个副本。由于新变量不存在于原始变量中，因此我们将不再有等效的公式；但因为当且仅当表达式为真时变量才为真，所以它是可等满足的。

如果我们想使用x作为缩写y，我们会说x ≡ y。这与x → y and y → x，这与(¬x ∨ y) ∧ (¬y ∨ x)，它已经存在于 CNF 中。

考虑产品术语的缩写：x ≡ (a ∧ b)。这是x → (a ∧ b) and (a ∧ b) → x，它由三个子句组成：(¬x ∨ a) ∧ (¬x ∨ b) ∧ (¬a ∨ ¬b ∨ x)。一般来说，将 k 个文字的乘积项缩写为x将产生 k 个二元子句，表示x意味着它们中的每一个，并且一个(k+1)- 子句表示它们一起意味着x。这是线性的k.

要真正了解为什么这有帮助，请尝试转换(a ∧ b ∧ c) ∨ (d ∧ e ∧ f) ∨ (g ∧ h ∧ i)到第一个乘积项具有或不具有扩展变量的等效 CNF。当然，我们不会仅仅停留在一个术语上：如果我们缩写每个术语，那么结果恰好是一个 CNF 子句：(x ∨ y ∨ z)其中每个都缩写单个产品术语。这个小了很多！

这种方法可用于转动任何circuit转化为可等满足的公式，大小和 CNF 呈线性。这被称为切丁转化 https://en.wikipedia.org/wiki/Tseytin_transformation。您的 DNF 公式只是一个由一堆任意扇入与门组成的电路，所有输入都馈入单个任意扇入或门。

最重要的是，尽管由于附加变量，该公式并不等效，但我们可以通过简单地删除扩展变量来恢复原始公式的赋值。它是一种“最佳情况”可等满足公式，是原始公式的严格超集。

为了将其修补到您的代码中，我添加了：

# Uses pseudo-namespacing to avoid collisions.
_EXT_SUFFIX = "___"
_NEXT_EXT_INDEX = 0


def is_ext_var(element) -> bool:
    return element.endswith(_EXT_SUFFIX)


def ext_var() -> str:
    global _NEXT_EXT_INDEX
    ext_index = _NEXT_EXT_INDEX
    _NEXT_EXT_INDEX += 1

    return intern(f"{ext_index}{_EXT_SUFFIX}")

这让我们可以凭空提取一个新的命名变量。由于这些扩展变量名称对您的解决方案显示函数没有有意义的语义，因此我更改了：

point_to_value = {
    point: value for point, value in [fact.split() for fact in self.solution]
}

into:

point_to_value = {
    point: value
    for point, value in [
        fact.split() for fact in self.solution if not is_ext_var(fact)
    ]
}

当然有更好的方法可以做到这一点，这只是一个补丁。 :)

重新实现你的from_dnf有了上面的想法，我们得到：

def from_dnf(groups) -> "cnf":
    "Convert from or-of-ands to and-of-ors, equisatisfiably"
    cnf = []

    extension_vars = []
    for group in groups:
        extension_var = ext_var()
        neg_extension_var = neg(extension_var)

        imply_ext_clause = []
        for literal in group:
            imply_ext_clause.append(neg(literal))
            cnf.append((neg_extension_var, literal))

        imply_ext_clause.append(extension_var)
        cnf.append(tuple(imply_ext_clause))

        extension_vars.append(extension_var)

    cnf.append(tuple(extension_vars))
    return cnf

每个组都有一个扩展变量。组中的每个文字都将其否定添加到(k+1)- 大小的蕴含子句，并由扩展隐含。处理文字后，扩展变量完成剩余的含义并将其自身添加到新扩展变量的列表中。最后，这些扩展变量中至少有一个必须为 true。

仅此一项更改就让我立即解决了这个 5x5 难题：

self.visible_from_top = [3, 2, 1, 4, 2]
self.visible_from_bottom = [2, 2, 4, 1, 2]
self.visible_from_left = [3, 2, 3, 1, 3]
self.visible_from_right = [2, 2, 1, 3, 2]
self.given_numbers = {}

我还添加了一些计时输出：

@property
def solution(self):
    if self._solution is None:
        start_time = time.perf_counter()

        cnf = self.cnf
        cnf_time = time.perf_counter()
        print(f"CNF: {cnf_time - start_time}s")

        self._solution = solve_one(cnf)
        end_time = time.perf_counter()
        print(f"Solve: {end_time - cnf_time}s")
    return self._solution

5x5 拼图给了我：

CNF: 0.00565183162689209s
Solve: 0.005589433014392853s

然而，我们仍然有那个讨厌的k!枚举可行的塔高度排列时的增长。

我生成了9x9 拼图 https://www.chiark.greenend.org.uk/%7Esgtatham/puzzles/js/towers.html#9:3/3/3/3/1/4/2/4/2/3/1/4/2/5/3/3/2/3/3/3/1/2/4/5/2/3/2/3/1/7/4/3/3/2/2/4,a5a4h3_2g7a5_1c1e7a4g2_2c8j7a6_3d2a1g6b（站点允许的最大），对应于：

self.visible_from_top = [3, 3, 3, 3, 1, 4, 2, 4, 2]
self.visible_from_bottom = [3, 1, 4, 2, 5, 3, 3, 2, 3]
self.visible_from_left = [3, 3, 1, 2, 4, 5, 2, 3, 2]
self.visible_from_right = [3, 1, 7, 4, 3, 3, 2, 2, 4]
self.given_numbers = {
    "AB": 5,
    "AD": 4,
    "BD": 3,
    "BE": 2,
    "CD": 7,
    "CF": 5,
    "CG": 1,
    "DB": 1,
    "DH": 7,
    "EA": 4,
    "EI": 2,
    "FA": 2,
    "FE": 8,
    "GG": 7,
    "GI": 6,
    "HA": 3,
    "HF": 2,
    "HH": 1,
    "IG": 6,
}

这给了我：

CNF: 28.505195066332817s
Solve: 40.48229135945439s

我们应该花更多的时间解决问题，减少生成的时间，但接近一半的时间都在生成。

在我看来，在 CNF-SAT 翻译中使用 DNF 通常是错误方法的标志。求解器比我们更善于探索和了解解空间——花费阶乘时间进行预探索实际上比求解器的指数最坏情况更糟糕。

“回退”到 DNF 是可以理解的，因为程序员自然会考虑“编写一个能够给出解决方案的算法”。但当您将其编码到问题中。让求解器推理解决方案变得不可行的条件。为此，我们需要从电路的角度进行思考。幸运的是，我们还知道如何快速将电路转变为 CNF。

_{†I said "often"; if your DNF is small and quick to produce (like a single circuit gate), or if encoding it to a circuit is prohibitively complicated, then it can be helpful to pre-compute some of the solution space.}

实际上你已经做了一些这样的事情！例如，我们需要一个电路来计算某个数字在一个范围（行或列）中出现的次数，并断言该数字恰好是一。然后对于每个跨度和每个数字，我们将发出这个电路。这样，如果一座塔的尺寸例如3 连续出现两次，该行 3 的计数器将发出“2”，并且我们关于其为“1”的断言将不会得到支持。

Your one_of约束是一种可能 https://www.semanticscholar.org/paper/SAT-Encodings-of-the-At-Most-k-Constraint-Some-Old-Frisch-Giannaros/69836f0bc61620368e76c7f0bd19f6ad7315a00a的实施。您使用“明显”的成对编码：对于跨度中的每个位置，如果 N 出现在该位置，那么它不会出现在任何其他位置。这实际上是一个非常好的编码，因为它几乎完全由二进制子句组成，并且 SAT 求解器喜欢二进制子句（它们使用的内存显着减少并且经常传播）。但对于真正需要计算的大量事物来说，这O(n^2)缩放可能会成为一个问题。

您可以想象一种替代方法，您可以从字面上编码加法器电路 https://en.wikipedia.org/wiki/Adder_(electronics)：每个位置都是电路的一个输入位，电路产生 n 位输出，告诉您最终的总和（上面的论文值得一读！）。然后，您可以使用强制特定输出位的单位子句断言该总和恰好为一。

仅对电路进行编码以强制其某些输出为恒定值似乎是多余的。然而，这更容易推理，并且现代求解器意识到编码可以做到这一点并对其进行优化。它们执行的处理过程比初始编码过程合理得多。使用求解器的“艺术”在于了解和测试这些替代编码何时比其他编码更有效。

注意exactly_k_of is at_least_k_of随着at_most_k_of。您已经在您的Q class ==执行。实施at_least_1_of是微不足道的，是一个子句；at_most_1_of很常见，通常被称为AMO。我鼓励你尝试实施< and >在本文中讨论的其他一些方法（甚至可能根据输入大小选择使用哪种方法）来感受它。

将我们的注意力转回到k!可见性约束，我们需要的是一个电路，告诉我们从某个方向可以看到多少座塔，然后我们可以断言它是一个特定值。

停下来想一想如何做到这一点，这并不容易！

类似于各种one_of方法，我们可以使用“纯”电路进行计数，或者使用更简单但缩放比例更差的成对方法。我在这个答案的最底部（‡）附上了纯电路方法的草图。现在我们将使用成对方法。

主要观察是，在不可见的塔中，我们不关心它们的排列。考虑：

3 -> 1 5 _ _ _ 9 _ _ _
     A B C D E F G H I

只要 CDE 组包含，我们就会从左边看到 3 座塔2, 3, and 4，同样如果 GHI 组包含6, 7, and 8。但它们在组中出现的顺序对可见的塔没有任何影响。

我们不会计算哪些塔是可见的，而是声明哪些塔是可见的并遵循它们的含义。我们将填写这个函数：

def visible_in_span(points: Collection[str], desired: int) -> "cnf":
    """Assert desired visible towers in span. Wlog, visibility is from index 0."""
    points = list(points)
    n = len(points)
    assert desired <= n

    cnf = []

    # ...

    return cnf

假设固定的跨度和观察方向：每个位置将有 k 个关联变量，Av1通过Avk说明“这是第 k 个可见的塔”。我们还将有Av ≡ (Av1 ∨ Av2 ∨ ⋯ ∨ Avk)意思是“A 有一座可见的塔”。

在上面的例子中，Av1, Bv2, and Fv3都是真的。排放有一些明显的含义。在某个位置，最多其中一个是正确的（你不能同时是第一个和第二个可见的塔）——但不是exactly一，因为拥有一座不可见的塔是完全可以的。另一个是，如果一个位置是第 k 个可见塔，则没有其他位置也是第 k 个可见塔。

到目前为止我们可以添加这个：

is_kth_visible_tower_at = {}
is_kth_visible_tower_vars = collections.defaultdict(list)
is_visible_tower_at = {}
for point in points:
    is_visible_tower_vars = []
    for k in range(1, n + 1):
        # Xvk
        is_kth_visible_tower_var = ext_var()

        is_kth_visible_tower_at[(point, k)] = is_kth_visible_tower_var
        is_kth_visible_tower_vars[k].append(is_kth_visible_tower_var)
        is_visible_tower_vars.append(is_kth_visible_tower_var)

    # Xv
    is_visible_tower_at_var = ext_var()
    # Xv → (Xv1 ∨ Xv2 ∨ ⋯)
    cnf.append(tuple([neg(is_visible_tower_at_var)] + is_visible_tower_vars))
    # (Xv1 ∨ Xv2 ∨ ⋯) → Xv
    for is_visible_tower_var in is_visible_tower_vars:
        cnf.append((neg(is_visible_tower_var), is_visible_tower_at_var))

    is_visible_tower_at[point] = is_visible_tower_at_var

    # At most one visible tower here.
    cnf += Q(is_visible_tower_vars) <= 1

# At most one kth visible tower anywhere.
for k in range(1, n + 1):
    cnf += Q(is_kth_visible_tower_vars[k]) <= 1

接下来，我们需要对可见塔进行排序，以便第 k + 1 个可见塔位于第 k 个可见塔之后。这是通过第 k + 1 个可见塔迫使至少一个先前位置成为第 k 个可见塔来实现的。例如。，Dv3 → (Av2 ∨ Bv2 ∨ Cv2) and Cv2 → (Av1 ∨ Bv1)。我们知道Av1始终为真，这提供了基本情况。（如果我们进入需要 B 成为第三个可见塔的情况，则需要 A 成为第二个可见塔，这与Av1.)

# Towers are ordered.
for index, point in enumerate(points):
    if index == 0:
        cnf += basic_fact(is_kth_visible_tower_at[(point, 1)])
        continue

    for k in range(1, n + 1):
        # Xvk → ⋯
        implication = [neg(is_kth_visible_tower_at[(point, k)])]

        j = k - 1
        if j > 0:
            for index_j, point_j in enumerate(points):
                if index_j == index:
                    break

                # ⋯ ∨ Wxj ∨ ⋯
                implication.append(is_kth_visible_tower_at[(point_j, j)])

        cnf.append(tuple(implication))

到目前为止一切顺利，但我们还没有将塔的高度与能见度联系起来。上述将允许9 8 7作为解决方案，调用9第一个可见的塔，8第二个，和7第三。为了解决这个问题，我们希望塔的放置能够防止较小的塔也可见。

每个位置将再次收到一组缩写，指示它是否被遮挡在一定高度以下，称为Ao1, Ao2，等等。这将为我们提供一个“网格”，让事情变得更简单。首先，较高的塔被遮挡意味着同一位置的下一个最高的塔也被遮挡，因此Ao3 → Ao2 and Ao2 → Ao1。第二个是，如果一座塔在一个位置被遮挡，那么它在以后的所有位置也会被遮挡。这是Ao3 → Bo3 and Bo3 → Co3等等。

is_height_obscured_at = {}
is_height_obscured_previous = [None] * n
for point in points:
    is_obscured_previous = None
    for k in range(1, n + 1):
        # Xok
        is_height_obscured_var = ext_var()

        # Wok → Xok
        is_k_obscured_previous = is_height_obscured_previous[k - 1]
        if is_k_obscured_previous is not None:
            cnf.append((neg(is_k_obscured_previous), is_height_obscured_var))

        # Xok → Xo(k-1)
        if is_obscured_previous is not None:
            cnf.append((neg(is_height_obscured_var), is_obscured_previous))

        is_height_obscured_at[(point, k)] = is_height_obscured_var
        is_height_obscured_previous[k - 1] = is_height_obscured_var
        is_obscured_previous = is_height_obscured_var

由此很容易看出，例如Bo4意味着其余高度等于或小于 4 的塔都被遮挡了。我们现在可以轻松地将塔的放置与默默无闻联系起来：A5 → Bo4.

# A placed tower obscures smaller later towers.
for index, point in enumerate(points):
    if index + 1 == len(points):
        break

    next_point = points[index + 1]
    for k in range(2, n + 1):
        j = k - 1

        # Xk → Yo(k-1)
        cnf.append((neg(comb(point, k)), is_height_obscured_at[(next_point, j)]))

最后，我们需要将模糊性与可见性联系起来。我们需要最后一组缩写，说明specific塔的高度在某个位置可见。冒着容易出现拼写错误的风险，我们将其称为Ahv对于一定高度h，以便Ahv ≡ (Ah ∧ Av)。一个具体的例子是C3v ≡ (C3 ∧ Cv)：当且仅当在 C 处有一座可见的塔时，高度为 3 的塔在 C 处可见，并且该塔是高度为 3 的塔。

is_height_visible_at = {}
for point in points:
    for k in range(1, n + 1):
        # Xhv
        height_visible_at_var = ext_var()

        # Xhv ≡ (Xh ∧ Xv)
        cnf.append((neg(height_visible_at_var), comb(point, k)))
        cnf.append((neg(height_visible_at_var), is_visible_tower_at[point]))
        cnf.append(
            (
                neg(comb(point, k)),
                neg(is_visible_tower_at[point]),
                height_visible_at_var,
            )
        )

        is_height_visible_at[(point, k)] = height_visible_at_var

这使我们能够得出对塔放置的最终影响。如果高度为 h 的塔被遮挡，则它是不可见的：Bo4 → ¬B4v。这是not等价，我们不能对待Bo4 ≡ ¬B4v; maybe ¬B4v成立，因为B4只是没有放置在那里（但它是可见的！）。

for point in points:
    for k in range(1, n + 1):
        # Xok → ¬Xkv
        cnf.append(
            (
                neg(is_height_obscured_at[(point, k)]),
                neg(is_height_visible_at[(point, k)]),
            )
        )

为了将其与特定谜题的可见性值联系起来，我们只需要禁止太多可见塔并确保所需的计数至少可见一个（因此恰好一次）：

# At least one of the towers is the desired kth visible.
cnf.append(tuple(is_kth_visible_tower_vars[desired]))

# None of the towers can be visible above the desired kth.
if desired < n:
    for is_kth_visible_tower_var in is_kth_visible_tower_vars[desired + 1]:
        cnf += basic_fact(neg(is_kth_visible_tower_var))

return cnf

我们只需要阻挡第一层不需要的第k个可见塔。由于第 k + 1 层意味着存在第 k 层可见塔，因此它也被排除。（等等。）

最后，我们将其挂接到 CNF 构建器中：

# Set visible from left
if self.visible_from_left:
    for index, row in enumerate(self.rows):
        target_visible = self.visible_from_left[index]
        if not target_visible:
            continue

        cnf += visible_in_span(row, target_visible)

# Set visible from right
if self.visible_from_right:
    for index, row in enumerate(self.rows):
        target_visible = self.visible_from_right[index]
        if not target_visible:
            continue

        cnf += visible_in_span(reversed(row), target_visible)

# Set visible from top
if self.visible_from_top:
    for index, col in enumerate(self.cols):
        target_visible = self.visible_from_top[index]
        if not target_visible:
            continue

        cnf += visible_in_span(col, target_visible)

# Set visible from bottom
if self.visible_from_bottom:
    for index, col in enumerate(self.cols):
        target_visible = self.visible_from_bottom[index]
        if not target_visible:
            continue

        cnf += visible_in_span(reversed(col), target_visible)

以上给了我更快的 9x9 解决方案：

CNF: 0.028973951935768127s
Solve: 0.07169117406010628s

速度提高了约 685 倍，并且求解器承担了更多的整体工作。又快又脏还不错！

有很多方法可以清理这个问题。例如，我们看到的每个地方cnf.append((neg(a), b))可能cnf += implies(a, b)而不是为了可读性。我们可以避免分配无意义的大 kth 可见变量，等等。

这还没有经过充分测试；我可能错过了一些含义或规则。希望此时很容易修复。

我想谈的最后一件事是 SAT 的适用性。也许现在很痛苦地清楚了，SAT 求解器并不擅长计数和算术。你必须降低到一个电路，从求解过程中隐藏更高级别的语义。

其他方法可以让你自然地表达算术、区间、集合等。答案集编程 (ASP) 就是一个例子，SMT 求解器是另一个例子。对于小问题，SAT 没问题，但对于困难问题，这些更高级别的方法可以大大简化问题。

他们中的每一个实际上可能在内部决定通过 SAT 解决（特别是 SMT）进行推理，但他们将在对问题的一些更高层次的理解的背景下这样做。

_{‡ 这是计数塔的纯电路方法。
它是否比pairwise更好取决于所计算的塔的数量；也许常数因子太高而没有用处，或者即使在小尺寸下它也非常有用。老实说，我不知道——我以前编码过巨大的电路并且让它们工作得很好。需要实验才能知道。
我去打电话Ah位置 A 中塔的整数高度。也就是说，而不是任一的 one-hot 编码A1 or A2或……或A9我们会有Ah0, Ah1， …，和Ahn作为 n 位整数的低位到高位（统称为Ah）。对于 9x9 的限制，4 位就足够了。我们还会有Bh, Ch，等等。
您可以使用连接两个表示A1 ≡ (¬Ah3 ∧ ¬Ah2 ∧ ¬Ah1 ∧ Ah0) and A2 ≡ (¬Ah3 ∧ ¬Ah2 ∧ Ah1 ∧ ¬Ah0) and A3 ≡ (¬Ah3 ∧ ¬Ah2 ∧ Ah1 ∧ Ah0)等等。我们有Ah = 3当且仅当A3已设置。（我们不需要添加只有一个值的约束Ah一次是可能的，因为与每个变量关联的独热变量已经这样做了。）
有了整数在手，可能会更容易了解如何计算可见性。我们可以将每个位置与最大可见塔高度相关联，名为Am, Bm，等等;显然第一座塔总是可见的并且是最高的，所以Am ≡ Ah。再说一遍，这实际上是一个 n 位值Am0通过Amn.
当且仅当塔的值大于先验的最高值时，塔才可见。我们将跟踪可见性Av, Bv，等等。这可以通过数字比较器 https://en.wikipedia.org/wiki/Digital_comparator;以便Bv ≡ Bh > Am. (Av是一个基本情况，并且总是正确的。）
这让我们也可以填写其余的最大值。Bm ≡ Bv ? Bh : Am，等等。条件/if-then-else/ite 是数字多路复用器。对于简单的 2 对 1，这很简单：Bv ? Bh : Am is (Bv ∧ Bh) ∨ (¬Bv ∧ Am)，这确实是(Bv ∧ Bhi) ∨ (¬Bv ∧ Ami)对于每个i ∈ 0..n.
然后，我们将有一堆单一输入Av通过Iv馈入加法器电路，告诉我们其中有多少输入是真实的（即有多少塔是可见的）。这将是另一个 n 位值；然后我们使用单元子句来断言它正是例如3，如果特定谜题需要 3 个可见的塔。
我们为每个方向的每个跨度生成相同的电路。这将是一些多项式大小的规则编码，添加许多扩展变量和许多子句。求解器可以了解到某个塔的放置是不可行的，不是因为我们这么说的，而是因为它意味着一些不可接受的中间可见性。 “应该有 4 个可见，而 2 个已经可见，所以剩下的就是……”。}

本文内容由网友自发贡献，版权归原作者所有，本站不承担相应法律责任。如您发现有涉嫌抄袭侵权的内容，请联系:hwhale#tublm.com(使用前将#替换为@)

pycosat中慢速dnf到cnf 的相关文章

MANIFEST.in、package_data 和 data_files 澄清吗？

我正在尝试创建一个 Python 包并且目录结构如下 mypkg init py module1 x py y py z txt module2 a py b py 然后我将所有文件添加到MANIFEST in当我检查创建的存档时它包含
Python 子进程（ffmpeg）仅在我按 Ctrl-C 程序时启动？

我正在尝试使用 Cygwin 和 Python 2 7 并行运行一些 ffmpeg 命令这大概是我所拥有的 import subprocess processes set commands ffmpeg i input mp4 outpu
pandas Wide_to_long 后缀参数

我对在 pandas 中使用 Wide to long 时的参数有疑问有一个参数叫suffix我不明白在文档中它说后缀 str 默认 d 捕获所需后缀的正则表达式 d 捕获数字后缀没有数字的后缀可以用否定字符类 D 指定您还可以进
ca 证书 Mac OS X

我需要在emacs 上安装offlineimap 和mu4e 问题是配置当我运行 Offlineimap 时我得到 OfflineIMAP 6 5 5 Licensed under the GNU GPL v2 v2 or any la
如何在 Google App Engine 的 Python 中获取 StringProperty 的值？

如何获取 nbd Model 的值我想返回由多个字段组成的描述但我无法让它工作这是我的班级代码 class User ndb Model name ndb StringProperty email ndb StringProperty
Python GTK + webkit - 在 gtk.main() 之后插入 JavaScript

我在终端中尝试了这个一切正常但是如果我在脚本内运行这个我无法在 gtk main 之后插入 JavaScript import gtk import webkit w gtk Window b webkit WebView w add
matplotlib 中的 R 风格数据轴缓冲区

R 绘图自动设置 x 和 y 限制以在数据和轴之间留出一些空间我想知道 matplotlib 是否有办法自动执行相同的操作如果没有是否有一个好的公式或经验法则来说明 R 如何设置其轴限制在 matplotlib 中您可以通过
Pandas 连接问题：列重叠但未指定后缀

我有以下数据框 print df a mukey DI PI 0 100000 35 14 1 1000005 44 14 2 1000006 44 14 3 1000007 43 13 4 1000008 43 13 print df b
对于相同的查询，MySQL Workbench 比 Python 快得多

MySQL Workbench 中的以下查询需要 0 156 秒才能完成 SELECT date time minute price id FROM minute prices WHERE contract id 673 AND TIMES
如何在Python代码中查找列号

简短问题当按上述方式调用函数时我可以找到行号here https stackoverflow com questions 3056048 filename and line number of python script 同样如何找到
张量流和线程

下面是来自 Tensorflow 网站的简单 mnist 教程即单层 softmax 我尝试通过多线程训练步骤对其进行扩展 from tensorflow examples tutorials mnist import input dat
Tensorflow 不分配完整的 GPU 内存

Tensorflow 默认分配所有 GPU 内存但我的新设置实际上只有 9588 MiB 11264 MiB 我预计大约 11 000MiB 就像我的旧设置一样张量流信息在这里 from tensorflow python client
在谷歌云上训练神经网络时出现“无法获取路径的文件系统”错误

我正在使用 Google Cloud 在云上训练神经网络如下例所示 https cloud google com blog big data 2016 12 how to classify images with tensorflow u
使用 WSGI 在 Windows XAMPP 中设置 Python 路径

我正在 Webfaction 上设置实时服务器的开发版本在本地计算机上的虚拟 Apache 服务器环境运行没有任何错误中运行 Django 应用程序 XP 使用 Python 2 6 运行 XAMPP Lite 我可以提交更改通过 G
uri 警告中缺少端口：使用 Python OpenCV cv2.VideoCapture() 打开文件时出错

当我尝试流式传输 ipcam 时出现了如下所示的错误 tcp 000000000048c640 uri 中缺少端口警告打开文件时出错 build opencv modules videoio src cap ffmpeg impl h
如何使用 django-pyodbc (ubuntu 16.04) 配置数据库设置 Django-MSSQL？

我是 Django 新手目前正在尝试使用另一个数据库来保存我的模型即MS SQL 我的数据库部署在docker容器中 903876e64b67 microsoft mssql server linux bin sh c opt mssq
在python中读取PASCAL VOC注释

我在 xml 文件中有注释例如这个它遵循 PASCAL VOC 约定
在 HDF5 (PyTables) 中存储 numpy 稀疏矩阵

我在使用 PyTables 存储 numpy csr matrix 时遇到问题我收到此错误 TypeError objects of type csr matrix are not supported in this context so
如何更改matplotlib中双头注释的头大小？

Below figure shows the plot of which arrow head is very small 我尝试了下面的代码但它不起作用它说引发 AttributeError 未知属性 s k 属性错误未知属性头宽
在父类中访问子类变量

我有一个父类和一个继承的子类我想知道如何访问我的父类中的子类变量我尝试了这个但失败了 class Parent object def init self print x class Child Parent x 1 x Child Er

随机推荐

有人能用例子解释一下java EE中的演示层.业务层.集成层这些词吗？

Java EE 中的这些是什么表示层商业层集成层我想通过示例了解这些模式是什么表示层用户看到的内容通常是 Web 应用程序业务层应用程序的所有逻辑都在其中执行集成层将系统连接到其他系统的层通过数据库连接 JMS We
Java Getter 和 Setter

在 Java 中是否有更好的标准方法来创建 getter 和 setter 必须为每个变量显式定义 getter 和 setter 这是相当冗长的有没有更好的标准注释方法 Spring有这样的东西吗即使 C 也有属性我不确定你是否会认
在 React 中使用 .map() 时处理空数组

我有一个 React JS 组件它将映射notes要显示的变量然而我遇到了没有笔记并收到错误的问题解决这个问题的正确方法是什么这是代码 import React Component from react class List ex
为什么 __getitem__(key) 和 get(key) 明显慢于 [key]？

据我了解括号只不过是一个包装器 getitem 以下是我对此进行基准测试的方法首先我生成了一个半大字典 items for i in range 1000000 items i 1 然后我使用cProfile测试了以下三个功能 de
通过 JavaScript 将变量从一个 html 页面传递到另一页面

我有两个页面第 1 页和第 2 页在第 1 页上有一个文本框其值为例如100 最后有一个按钮通过按下按钮我希望 javascript 将文本框的值保存在全局变量中并跳转到第 2 页通过 window onload 我想要第
在树视图 Odoo 13 外部添加按钮

再会有没有办法在 Odoo 的树视图上方添加一个按钮我想每当用户单击按钮时运行一个函数如果这不可能你能帮我找到替代方案吗这是我查看的代码
Rails、Backbone、PhoneGap、CORS（由于 Access-Control-Allow-Origin 错误而不允许）

我正在构建一个使用backbone js 和Rails 后端的Phonegap 应用程序创建新用户时我收到与 CORS 相关的错误我正在运行我的 PhoneGap Web 应用程序http 0 0 0 0 8000 python m
Set dict = CreateObject("Scripting.Dictionary") 循环直到工作表的数量

我有一个包含多个工作表的 Excel 文档当我从第一张纸返回到第二张纸后运行循环跳转时但在第二张纸上没有打开新字典并且我在 ln 16 处收到类似运行时错误 9 的错误 MySeries Cnt 2 Dt j 2 新词典打开时的每张
返回反转的列表

我有这个问题编写一个函数reverse3 nums 它接受长度为3的整数列表称为nums并返回一个新列表其中元素的顺序相反因此 1 2 3 变为 3 2 1 我通过以下方式解决了它 def reverse3 nums return
如何获取维基百科根类别的终端叶子

我只想获取维基百科类别的叶子但不知道如何获取我可以得到所有的叶子 SELECT subcat WHERE subcat skos broader category Buildings and structures in France b
Cocoa 应用程序如何将自身添加为全局登录项？

I tried LSSharedFileListRef globalLoginItems LSSharedFileListCreate NULL kLSSharedFileListGlobalLoginItems NULL if globa
在 HTML5 中，
和
标记可以出现在标记之外吗？

我目前以这种方式使用上述标签经典标签顺序
Pysolr：尝试查询时我不断收到 json.decoder 错误

import pysolr solr pysolr Solr http replaced url abc 8983 solr tran timings shard1 replica2 query timeout 10 results sol
Java GregorianCalendar 和 Calendar 错位了 2010 年 8 月和 9 月的周末、一个月中的日期

我正在尝试使用日历或公历来迭代并创建日期网格然而他们俩似乎都认为2010年8月有30天 9月2日和3日是周末就好像日历的年份错误但我已经对该参数进行了三次检查以下是一些摘录 startDate set 2010 8 28 Sche
为什么 IE7 无法识别锚标记上的 css 填充样式？

我的网站在 Firefox Safari Chrome 和 Opera 中运行良好但由于某种原因 IE7 无法识别任何锚标记上的 CSS 填充我无法弄清楚这一点在 IE7 中如果您查看主页上显示独家热门最近评论的选项卡htt
如何使用谷歌脚本检测两个单独行中的重复值？

我正在尝试使用 Google 脚本和 Google 电子表格检测 B 列中的值是否已在 A 列中提及这些列位于 2 个单独的工作表中由于某种原因我没有足够的经验来让它工作提前谢谢获取北欧 function insert e she
使用不同的指针类型作为参数来转换函数指针

我认为以下代码描述了我想要做的事情具体来说我希望将函数指针转换为通用函数类型签名的唯一区别是指针类型不同现在我知道函数指针需要兼容的正如所讨论的这个问题 https stackoverflow com questions 5595
python 3 字符串格式化（对齐）

我有一个代码其输出应如下所示 hello 3454 nice 222 bye 45433 well 3424 对齐和正确的理由给我带来了问题我在字符串 0 gt 7 中尝试了此操作但只有具有特定位数的数字才可以其他有一些数字的数字或
Android 中带手势（滑动功能）的 VideoView

我想合并默认值视频查看 and 手势监听器如果用户向左滑动则歌曲向后播放或向右滑动则歌曲向前播放我想在 VideoView 上实现类似的方法通过以下代码打开默认媒体播放器 Intent intent new Intent androi
pycosat中慢速dnf到cnf

问题简述有一个适当的输入pycosat https pypi org project pycosat 有没有办法加速从dnf到cnf的计算或者完全绕过它详细问题我一直在看这个视频 https www youtube com watc

pycosat中慢速dnf到cnf

pycosat中慢速dnf到cnf 的相关文章

随机推荐

热门标签