混合专家系统（MoE）_moe模型_link管理

添加链接

注册登录

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

相关文章推荐

腼腆的匕首 · n行Python代码系列：两行代码调整视频播 ...· 1 年前 ·

憨厚的瀑布 · 如何以【我穿成了耽美文里的恶毒女配】为开头写 ...· 1 年前 ·

忐忑的机器猫 · 深入理解ChatGPT：从机器学习到深度学习 ...· 1 年前 ·

光明磊落的大象 · 堆栈与堆（StackvsHeap）：有什么区 ...· 1 年前 ·

冷冷的红金鱼 · 稳中求进保时捷迈入电气化新纪元 - ...· 1 年前 ·

本文介绍了一种名为混合专家系统(MoE)的神经网络模型，它适用于数据产生方式不同的数据集。文章详细解释了MoE的工作原理，包括competitiveMoE和cooperativeMoE两种架构，并给出了具体的数学公式。摘要生成于，由 DeepSeek-R1 满血版支持，

混合专家系统（Mixture of Experts）

混合专家系统（MoE）是一种神经网络，也属于一种combine的模型。适用于数据集中的数据产生方式不同。不同于一般的神经网络的是它根据数据进行分离训练多个模型，各个模型被称为专家，而 门控模块 用于选择使用哪个专家，模型的实际输出为各个模型的输出与门控模型的权重组合。各个专家模型可采用不同的函数（各种线性或非线性函数）。混合专家系统就是将多个模型整合到一个单独的任务中。

混合专家系统有两种架构：competitive MoE 和cooperative MoE。competitive MoE中数据的局部区域被强制集中在数据的各离散空间，而cooperative MoE没有进行强制限制。

对于较小的数据集，该模型的表现可能不太好，但随着数据集规模的增大，该模型的表现会有明显的提高。

定义X为N d维输入，y为N c维输出,K为专家数，$\lambda $为学习率：

(0...(c−1))for\ j\ in (0...(d-1))\ and\ i\ in\ (0...(c-1))

(其中 $w_{ik}$

第k个专家输出均值为：

mk=∑i=0c−1Vikm_{k}=\sum_{i=0}^{c-1}V_{ik}

门限模块输出为：

gk=emkT∑kemkTg_{k}=\frac{e^{m_{k}^{T}}}{\sum_{k}e^{m_{k}^{T}}}

y_i

实验结果：

不同数据集相同k值：

k=2使用线性数据集，采用SGD和FTRL两种训练方式，结果如下：

这里写图片描述

k=2使用非线性数据集，采用SGD和FTRL两种训练方式，结果如下：

相同数据集不同k值：

MoE 理论参考：https://goker.wordpress.com/2011/07/01/mixture-of-experts/实现代码import numpy as np import random import matplotlib.pyplot as pltclass MOE : def __init__ ( self, train_x, train_y, k = 4, lamda =
该存储库包含实现专家模型的卷积和密集混合的Keras层。专家层的密集混合物文件Dense MoE .py包含一个Dense MoE .py层，该层实现了专家模型的密集混合：该层可以与Dense层相同的方式使用。它的一些主要论据如下： units ：输出维数 n_experts ：专家人数（） expert_activation ：专家模型的激活功能（） gating_activation ：门控模型的激活函数（）请参阅Dense MoE .py以获取其他参数。卷积专家层文件Convolutional MoE .py包含实现专家模型的1D，2D和3D卷积混合的Keras层：其中*表示卷积运算。这些层可以以与相应的标准卷积层（ Conv1D ， Conv2D ， Conv3D ）相同的方式使用。文件conv_ moe _demo.py包含一个示例，

推荐文章

腼腆的匕首 · n行Python代码系列：两行代码调整视频播放速度_python中改变继续教育网页中视频的播放速度-CSDN博客

1 年前

憨厚的瀑布 · 如何以【我穿成了耽美文里的恶毒女配】为开头写一篇文? - 知乎

1 年前

忐忑的机器猫 · 深入理解ChatGPT：从机器学习到深度学习-百度开发者中心

1 年前

光明磊落的大象 · 堆栈与堆（StackvsHeap）：有什么区别？图文并茂拆解代码解析！-电子工程专辑

1 年前

冷冷的红金鱼 · 稳中求进保时捷迈入电气化新纪元 - Dr. Ing. h.c. F. Porsche AG. 新闻数据库

1 年前

Link管理 · Sov5搜索 · 小百科

link管理 - 链接快照平台