百战-AI算法工程师就业班夸克网盘资源_网盘资源_夸克网盘资源搜索_全盘搜 file:人工智能课件.txt file:8-GreedySearch和BeamSearch解码的方式与代码逻辑【网盘分享WPFX.LINK】.mp4 file:9-CPTN项目代码剖析【网盘分享WPFX.LINK】.mp4 file:2-OCR识别本质就是文字检测和文字识别【网盘分享WPFX.LINK】.mp4 file:6-CTC损失函数前向后向算法推导_梯度求导公式推导【网盘分享WPFX.LINK】.mp4 file:16-FaceNet论文_TripleSelection很至关重要【网盘分享WPFX.LINK】.mp4 file:7-每一个阶段每个分支的Loss损失_整合每个分支的Loss【网盘分享WPFX.LINK】.mp4 file:9-总结MTCNN_缩放因子_注意3阶段网络里面的全连接【网盘分享WPFX.LINK】.mp4 file:18-人脸识别项目代码_FaceNet模型加载和使用【网盘分享WPFX.LINK】.mp4 file:8-训练数据的准备_每一阶段训练的流程【网盘分享WPFX.LINK】.mp4 file:1-DDPG解决DQN不能输出连续型动作的问题_DDPG如何训练Actor和Critic【网盘分享WPFX.LINK】.mp4 file:8-PPO_重要性采样的问题_期望矫正但是方差还是不同带来的问题【网盘分享WPFX.LINK】.mp4 file:10-代码实战_PPO与环境整体交互_Actor与Critic网络构建【网盘分享WPFX.LINK】.mp4 file:5-TD3_使用DoubleNetwork优化DDPG【网盘分享WPFX.LINK】.mp4 file:7-PPO_通过重要性采样使得PPO可以做Off-Policy学习【网盘分享WPFX.LINK】.mp4 file:12-代码实战_剖析PPO代码中如何体现Off-Policy的学习方式_效果展示【网盘分享WPFX.LINK】.mp4 file:15-代码实战_DPPO_GlobalPPO和Workers交替执行【网盘分享WPFX.LINK】.mp4 file:3-代码实战_DDPG_Critic网络构建_Actor网络链式求导【网盘分享WPFX.LINK】.mp4 file:6-PPO_强调AC如何输出连续型动作_区分On-Policy与Off-Policy【网盘分享WPFX.LINK】.mp4 file:9-PPO_PPO1、TRPO、PPO2三种不同的方式解决两个分布不同的问题【网盘分享WPFX.LINK】.mp4 file:2-代码实战_DDPG_构建Actor和Critic四个网络_定义Critic求loss和求梯度的逻辑【网盘分享WPFX.LINK】.mp4 file:2-AdvantageActorCritic_共享参数和修改reward技巧【网盘分享WPFX.LINK】.mp4 file:7-Pendulum环境_根据网络预测的μ和σ得到连续型的action值【网盘分享WPFX.LINK】.mp4 file:14-代码实战_A3C_讲解线程中worker和GlobalNet交互_代码运行效果展示【网盘分享WPFX.LINK】.mp4 file:8-代码实战_A3C_讲解Coordinator调度多线程运算【网盘分享WPFX.LINK】.mp4 file:1-ActorCritic原理_把PG和QLearning结合起来【网盘分享WPFX.LINK】.mp4 file:10-代码实战_A3C_增加actor探索性用到熵_定义worker正太分布抽样和求梯度的逻辑【网盘分享WPFX.LINK】.mp4 file:12-代码实战_A3C_结合流程图分三点总结前面讲的代码【网盘分享WPFX.LINK】.mp4 file:9-代码实战_A3C_定义Worker计算loss的逻辑_针对连续型的action提高actor探索性【网盘分享WPFX.LINK】.mp4 file:3-ε-greedy_ReplayBuffer_FixedQ-targets【网盘分享WPFX.LINK】.mp4 file:10-DoubleDQN缓解over-estimate【网盘分享WPFX.LINK】.mp4 file:8-代码实战DQN_训练阶段最小化损失_记录loss方便展示_随着learn的越多选择action随机性减小【网盘分享WPFX.LINK】.mp4 file:14-计算Action的方差避免风险【网盘分享WPFX.LINK】.mp4 file:4-代码实战DQN_Agent和Env整体交互【网盘分享WPFX.LINK】.mp4 file:13-困难样本挖掘_Multi-step_NoiseyNet系统的探索【网盘分享WPFX.LINK】.mp4 file:15-Rainbow_DQN如何计算连续型的Actions【网盘分享WPFX.LINK】.mp4 file:5-策略梯度PG_讲解CartPole环境【网盘分享WPFX.LINK】.mp4 file:10-策略梯度PG_同一个回合中不同的action回溯不同的TotalReward_代码实战【网盘分享WPFX.LINK】.mp4 file:2-引入马尔科夫链和价值评估的Q值与V值【网盘分享WPFX.LINK】.mp4 file:13-代码实战SarsaLambda_训练模型【网盘分享WPFX.LINK】.mp4 file:1-强化学习通过智能体与环境交互进行学习【网盘分享WPFX.LINK】.mp4 file:6-SARSA算法和Q-learning算法【网盘分享WPFX.LINK】.mp4 file:7-理解Q-table_创建maze交互环境【网盘分享WPFX.LINK】.mp4 file:2-正则化通过损失函数加入惩罚项使得W越小越好【网盘分享WPFX.LINK】.mp4 file:5-通过L1和L2的导函数理解区别的本质原因【网盘分享WPFX.LINK】.mp4 folder:百战-AI算法工程师就业班 folder:31--【加课】 强化学习【新增】 folder:5--机器学习-线性回归 folder:14--深度学习-图像识别原理 folder:11--机器学习与大数据-海量数据挖掘工具 folder:27--【加课】算法与数据结构 folder:4--人工智能基础-高等数学知识强化 folder:3--人工智能基础-Python科学计算和可视化 folder:20--深度学习-NLP自然语言处理项目实战 folder:26--【加课】Linux 环境编程基础 folder:24--【加课】Pytorch项目实战 folder:16--深度学习-目标检测YOLO(V1-V4全版本)实战 folder:25--【加课】百度飞桨PaddlePaddle实战【新增】 folder:课件 folder:5--DDPG、PPO、DPPO算法 folder:4--Actor Critic (A3C) folder:2--Deep Q-Learning Network folder:3--Policy Gradient 策略梯度 folder:1--Q-Learning与SARSA算法 folder:4--正则化 folder:5--Lasso回归_Ridge回归_多项式回归 folder:2--梯度下降法 folder:3--经典卷积网络算法 folder:5--现代目标检测之FasterRCNN folder:2--Spark计算框架深入 folder:3--Spark机器学习MLlib和ML模块 folder:1--贝叶斯分类 folder:3--线性代数基础 folder:2--一元函数微分学 folder:2--自然场景下的目标检测及源码分析 folder:1--科学计算模型Numpy folder:2--数据可视化模块 folder:3--数据处理分析模块Pandas folder:4--Seq2Seq聊天机器人 folder:2--自然语言处理--情感分析 folder:6--BERT新浪新闻10分类项目 folder:5--实战NER命名实体识别项目 folder:1--药店销量预测案例 folder:1--推荐系统--流程与架构 folder:2--推荐系统--数据预处理和模型构建评估实战 folder:3--推荐系统--模型使用和推荐服务 folder:1--PyTorch运行环境安装_运行环境测试 folder:4--PyTorch循环神经网络_词性标注 folder:2--PyTorch基础_Tensor张量运算 folder:2--Python基础语法 folder:3--YOLOv3详解 folder:4--XGBoost folder:2--集成学习和随机森林 folder:2--TensorFlow深度学习工具 folder:3--反向传播推导_Python代码实现神经网络 folder:3--PaddleDetection工具_PCB电路板缺陷检测 folder:2--PaddlePaddle卷积网络_病理性近视识别 folder:6--PaddleNLP模块_物流信息提取(ERNIE版) folder:4--PaddleOCR工具_车牌识别(目标检测+CRNN+CTCLoss) folder:2--Softmax回归 folder:3--SVM支持向量机算法 folder:2--机器学习和深度学习、有监督和无监督 folder:1--人工智能就业、薪资、各行业应用 folder:2--EM算法和GMM高斯混合模型 folder:2--循环神经网络原理与优化 folder:3--从Attention机制到Transformer folder:4--ELMO_BERT_GPT folder:1--上采样_双线性插值_转置卷积 folder:2--医疗图像UNet语义分割 folder:3--蒙版弹幕MaskRCNN语义分割 分享时间 2025-03-28 入库时间 2025-03-28 状态检测 有效 资源类型 QUARK 分享用户 夸父*714 资源有问题?点此举报 链接 跳转 分享