当前位置:首页 > GESP > (2023年GESP七级)洛谷P10111题解:动态规划求解纸牌游戏

(2023年GESP七级)洛谷P10111题解:动态规划求解纸牌游戏

4周前 (08-17)

(2023年GESP七级)洛谷P10111题解:动态规划求解纸牌游戏 动态规划 三维DP 洛谷题解 GESP GESP七级 第1张

一、题目解读

洛谷P10111题(2023年GESP七级)是一个经典的动态规划问题,涉及循环胜负关系下的最优策略设计。题目背景可类比为“剪刀-石头-布”的循环胜负游戏:存在三种元素(如卡牌),两两之间形成循环克制关系(如0克2、1克0、2克1),玩家需通过换牌操作在多轮对决中最大化得分。题目要求处理N轮比赛,每轮可选择出牌或换牌(需消耗代价),需找到最优出牌顺序以获取最高总分。

二、解题思路

三维动态规划解决该问题。核心思路为:通过状态定义拆分决策维度,利用状态转移方程实现最优解的递推。关键在于将“换牌次数”作为独立维度,避免状态爆炸的同时精准记录代价。具体设计如下:

● 状态定义:dp[i][j][k]表示第i轮出牌j,累计换牌k次时的最大得分。

状态转移:分为“不换牌”与“换牌”两种情况,前者延续上一轮策略,后者需扣除换牌代价并更新出牌类型。

● 边界条件:首轮仅依赖初始牌与对手牌计算得分,后续轮次通过递推更新最优值。

三、解题步骤

1. 数据输入:读入N轮比赛的卡牌序列a、b、c(含换牌代价)。

2. 初始化DP表:首轮状态仅与初始出牌相关,调用get_score()计算平局/胜负得分。

3. 动态规划循环:

○ 外层遍历轮次i,内层遍历上一轮状态(出牌prev_j、换牌次数prev_k)。

○ 若上一状态无效(INT_MIN),跳过。

○ 不换牌:直接比较得分更新当前状态。

○ 换牌:遍历新出牌类型new_j,扣除代价b[prev_k]后计算总分,更新dp[i][new_j][prev_k+1]。

4. 结果输出:遍历最后一轮所有状态,取最大值即为最优得分。

四、代码及注释

#include <iostream>
#include <vector>
#include <algorithm>
#include <climits>
using namespace std;

// 判断胜负关系,返回得分
int get_score(int my_card, int yang_card, int a) {
    if (my_card == yang_card) return a; // 平局
    if ((my_card == 1 && yang_card == 0) ||
        (my_card == 2 && yang_card == 1) ||
        (my_card == 0 && yang_card == 2)) {
        return 2 * a; // 获胜
    }
    return 0; // 失败
}

int main() {
    ios::sync_with_stdio(false);
    cin.tie(nullptr);
    
    int N;
    cin >> N;
    
    vector<int> a(N), b(N-1), c(N);
    for (int i = 0; i < N; ++i) cin >> a[i];
    for (int i = 0; i < N-1; ++i) cin >> b[i];
    for (int i = 0; i < N; ++i) cin >> c[i];
    
    // dp[i][j][k]: 第i轮出牌j,换了k次牌的最大得分
    vector<vector<vector<int>>> dp(N, vector<vector<int>>(3, vector<int>(N, INT_MIN)));
    
    // 初始化第一轮
    for (int j = 0; j < 3; ++j) {
        dp[0][j][0] = get_score(j, c[0], a[0]);
    }
    
    // 动态规划
    for (int i = 1; i < N; ++i) {
        for (int prev_j = 0; prev_j < 3; ++prev_j) {
            for (int prev_k = 0; prev_k < N; ++prev_k) {
                if (dp[i-1][prev_j][prev_k] == INT_MIN) continue;
                
                // 不换牌
                int score = get_score(prev_j, c[i], a[i]);
                if (dp[i][prev_j][prev_k] < dp[i-1][prev_j][prev_k] + score) {
                    dp[i][prev_j][prev_k] = dp[i-1][prev_j][prev_k] + score;
                }
                
                // 换牌(不能超过N-1次)
                if (prev_k < N-1) {
                    for (int new_j = 0; new_j < 3; ++new_j) {
                        if (new_j == prev_j) continue;
                        score = get_score(new_j, c[i], a[i]);
                        int new_score = dp[i-1][prev_j][prev_k] + score - b[prev_k];
                        if (dp[i][new_j][prev_k+1] < new_score) {
                            dp[i][new_j][prev_k+1] = new_score;
                        }
                    }
                }
            }
        }
    }
    
    // 找出最大得分
    int max_score = INT_MIN;
    for (int j = 0; j < 3; ++j) {
        for (int k = 0; k < N; ++k) {
            max_score = max(max_score, dp[N-1][j][k]);
        }
    }
    
    cout << max_score << endl;
    
    return 0;
}

五、总结

本文通过三维动态规划解决了洛谷P10111题的循环胜负优化问题,核心在于将换牌次数独立为状态维度,并通过精细的状态转移方程平衡得分与代价。该解法兼具理论深度与实践价值,对类似“多阶段决策+资源约束”问题具有参考意义。掌握此类动态规划设计思路,可显著提升算法竞赛与工程优化的解题能力。

原创内容 转载请注明出处

分享给朋友:

相关文章

2025年GESP七级等价消除(洛谷P11965)代码解析与优化策略

2025年GESP七级等价消除(洛谷P11965)代码解析与优化策略

一、题目解读    2025年GESP七级考试中的“等价消除(洛谷P11965)”问题要求统计给定字符串中满足等价条件的子串数量。所谓“等价子串”,是指子串中所...

牛客12576题解题全解析:动态规划+质因数分解实现跳跃问题最优解

牛客12576题解题全解析:动态规划+质因数分解实现跳跃问题最优解

一、题目解读牛客12576题是一道经典的算法题,要求给定起点N和终点M,求解从N到M的最少跳跃次数。题目考察的核心在于路径优化与动态规划思想,需结合数论中的质因数分解技巧,通过合理设计算法降低时间复杂...

NOIP 2008火柴棒等式题解(C++代码实现)  动态规划与枚举算法详解

NOIP 2008火柴棒等式题解(C++代码实现) 动态规划与枚举算法详解

一、题目解读火柴棒等式问题(NOIP 2008,洛谷P1149)要求使用给定数量的火柴棒,构造形如 A + B = C 的等式,其中A、B、C均为整数,且火柴棒总数恰好等于输入值。需统计符合条件的等式...

LeetCode 120题三角形最小路径和最优解法:动态规划详解与代码实现

LeetCode 120题三角形最小路径和最优解法:动态规划详解与代码实现

一、题目解读LeetCode 120题“三角形最小路径和”要求给定一个由数字组成的三角形,从顶部开始向下移动,每次可向左或向右移动一格,计算从顶至底的最小路径和。三角形以二维向量形式给出,每层元素数量...

洛谷P4551题解题报告:图论与Trie树优化异或路径问题的实战解析

洛谷P4551题解题报告:图论与Trie树优化异或路径问题的实战解析

一、题目解读洛谷P4551题要求在一个无向图中,寻找任意两点路径权值异或后的最大值。题目输入为图的边信息(点数n和n-1条边),每条边包含起点、终点及权值。需输出所有路径中权值异或的最大值。问题核心在...

CSP-J 2019公交换乘题解析:基于队列优化的动态规划代码详解

CSP-J 2019公交换乘题解析:基于队列优化的动态规划代码详解

一、题目解读CSP-J 2019年的“公交换乘”题目(洛谷P5661)要求模拟地铁与公交交替出行的费用计算。题目核心在于地铁消费会产生优惠券,而公交可在45分钟内使用优惠券抵扣车费。需要处理n条出行记...

发表评论

访客

看不清,换一张

◎欢迎参与讨论,请在这里发表您的看法和观点。