添加链接
link管理
链接快照平台
  • 输入网页链接,自动生成快照
  • 标签化管理网页链接
AIGC探索之旅 介绍

你好,我是P小二,我一直都是在AI领域工作,有七年NLP,三年AI架构的经验。目前在AIGC方向创业,这个专栏是想和AIGC相关的朋友多交流。

本专栏主要是关于AIGC方向的论文解读,技术研究,案例分析和落地经验分享。

目前保持周更两篇+一篇AIGC周刊。

加入专栏交流群(强烈推荐)可加微信:pxiaoer2025。

目前成为永久读者价格:199元,后面将逐步涨价。

AIGC周刊 | 第18期

时间: 2023.3.5-2023.3.12本周大事记1. 微软公布视觉ChatGPT3月8号,微软公布了自己的Visual ChatGPT论文Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models论文: https://arxiv.org/abs/2303.04671代码: https://github.com/microsoft/visual-chatgptdemo: https://huggingface.co/spaces/microsoft/visual_chatgpt有人把Visual ChatGPT这篇论文当一篇工程性的文章,不就是chatGPT和几个开源文生图模型的整合么?其实它可以是一个多模态的训练框架, 提供了统一数据,统一架构,统一的解决流程。当然目前也有很多限制,期待后面的更新迭代吧。相关链接:视觉ChatGPT来了,微软发布,代码已开源https://mp.weixin.qq.com/s/w0jx7FKNw2y-LCY3OtlPJg中文支持版本https://github.com/wxj630/visual-chatgpt-zh2. Together发布OpenChatKit,一个开源ChatGPT的平替Together团队发布了ChatGPT的开源平替OpenChatKit,源代码、模型权重和训练数据集全部公开,由前OpenAI研究员共同打造。OpenChatKit一共包含200亿参数,在EleutherAI的GPT-NeoX-20B上进行了微调。介绍: https://www.together.xyz/blog/openchatkit代码:https://github.com/togethercomputer/OpenChatKitdemo:https://huggingface.co/spaces/togethercomputer/OpenChatKit模型: https://huggingface.co/togethercomputer/GPT-NeoXT-Chat-Base-20B相关链接:ChatGPT开源平替来了,开箱即用!前OpenAI团队打造,GitHub刚发布就揽获800+星https://mp.weixin.qq.com/s/-MEOhOVut2dCvbF5N6UfyQTogether Releases The First Open-Source ChatGPT Alternative Called OpenChatKithttps://www.marktechpost.com/2023/03/12/together-releases-the-first-open-source-chatgpt-alternative-called-openchatkit/最新技术:Tag2Text: Guiding Vision-Language Model via Image Tagging论文: arxiv.org/abs/2303.05657主页:tag2text.github.ioRewarding Chatbots for Real-World Engagement with Millions of Users论文: arxiv.org/abs/2303.06135模型: huggingface.co/ChaiMLRodin: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion论文: https://arxiv.org/abs/2212.06135主页: https://3d-avatar-diffusion.microsoft.com/Open-world Instance Segmentation: Top-down Learning with Bottom-up Supervision主页: https://tarun005.github.io/UDOSA Comprehensive Survey of AI-Generated Content (AIGC)论文: https://arxiv.org/abs/2303.04226X-Avatar: Expressive Human Avatars论文:https://arxiv.org/abs/2303.04805ChatGPT for Training Data论文: arxiv.org/abs/2302.13007Speak Foreign Languages with Your Own Voice: Cross-Lingual Neural Codec Language Modeling论文: arxiv.org/abs/2303.03926主页: vallex-demo.github.ioUDAPDR: Unsupervised Domain Adaptation via LLM Prompting and Distillation of Rerankers论文:https://arxiv.org/pdf/2303.00807.pdfHiCLIP: Contrastive Language-Image Pretraining with Hierarchy-aware Attention论文: https://arxiv.org/abs/2303.02995Prismer: A Vision-Language Model with An Ensemble of Experts论文: https://arxiv.org/abs/2303.02506主页: https://shikun.io/projects/prismer代码: https://github.com/NVlabs/prismer课程:适配Diffusers框架的全套教程来了!从T2I-Adapter到大热ControlNet https://mp.weixin.qq.com/s/3cIr0KWrIE9TaVYV-6q4gQRunning LLaMA 7B and 13B on a 64GB M2 MacBook Pro with llama.cpp https://til.simonwillison.net/llms/llama-7b-m2商业:ChatGPT让亚马逊梦碎!微软CEO:Alexa、Siri、Cortana笨得和石头一样https://mp.weixin.qq.com/s/D5qGJMEcGhc2wAXHWlY8yQ企业级 Azure OpenAI ChatGPT 服务发布(国际预览版) https://mp.weixin.qq.com/s/oNM3SvMVk2dYSJhaF_bUigGPT-4将于下周发布,微软德国CTO:将提供完全不同的可能性 https://mp.weixin.qq.com/s/UgUaYL7HBgSawmvxlcARdg案例:AI画图实例:如何用Stable Diffusion创作游戏场景https://mp.weixin.qq.com/s/JO-LQXcnpkderR9QDx9y1wtyping-mind: ChatGPT 的UIhttps://www.producthunt.com/posts/typing-mindControlNet仅靠一张照片完成“旧房改造” https://mp.weixin.qq.com/s/OK12c91LgpyDUgdePP5Q9wAI再出王炸工具!一键实现CG制作全流程?https://mp.weixin.qq.com/s/S4exT1ySqJ5Wq-GlOibCxgCharacter.AI:个性化的ChatGPT,AI大模型时代的UGC平台 https://mp.weixin.qq.com/s/U4R8loz1G9PYM_l6IvNF_AAI角色直播https://www.twitch.tv/atheneaiheroesOpenGPThttps://open-gpt.app/d-di出品的,虚拟人视频聊天https://chat.d-id.comChatGPT版佛祖爆火出圈:施主,说出你的烦恼https://mp.weixin.qq.com/s/xk-AnFOQeJtnJsSMaJcDdQ

【论文解读】03. Visual ChatGPT:视觉ChatGPT

Visual ChatGPT标题: Visual ChatGPT: Talking, Drawing and Editing......

【游戏AI】03. 游戏资源生成平台scenario.gg

作为scenario.gg的最开始的内测用户,我来说说scenario.gg。scenario.gg 是一个游戏资源生成的平台,创始人叫Emm,目前已经拿到种子轮投资......

AIGC周刊 | 第17期

时间: 2023.2.27-2023.3.5本周大事记1. OpenAI ChatGPT API正式公布3月2日,ChatGPT API 正式公布,价格只有GPT3.5的十分之一。相关链接:https://openai.com/blog/introducing-chatgpt-and-whisper-apis2. 网友帮meta开源LLaMa2月24日,meta发布LLaMA(Large Language Model Meta AI),宣称开源,但是需要去填表申请,拿到回复邮件的时间并不确定。最近有网友帮忙,把已经拿到的模型发布在各大平台上并做成了测试demo,真正的帮meta开源。LLaMa模型,我也已经下载并传到了百度网盘,想下载的朋友可以在下面链接上找到。https://web.okjike.com/originalPost/6404b70d1f1113c2b7551feb相关链接:报道:Meta版ChatGPT惨遭“开源”?最新大模型LLaMA被泄露,已在GitHub收获7k+星https://mp.weixin.qq.com/s/L-7ggPv8Kb-PcFlhV78B9QMeta开源的ChatGPT平替到底好不好用?测试结果、加料改装方法已出炉,2天5.2k星https://mp.weixin.qq.com/s/kImwfWWtXMmEDVOhJZ4dJgGithub链接:https://github.com/facebookresearch/llama/pull/73/fileshuggingface上的模型下载:https://huggingface.co/ricecake/LLaMAllama-int8项目:https://github.com/tloen/llama-int8LLaMA-7B demo:https://huggingface.co/spaces/chansung/LLaMA-7BOpen source implementation for LLaMA-based ChatGPT training process https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama最新技术:Language Is Not All You Need: Aligning Perception with Language Models论文:https://arxiv.org/abs/2302.14045报道:微软多模态ChatGPT来了?16亿参数搞定看图答题、智商测验等任务https://mp.weixin.qq.com/s/aWqF25SwGTAtG5ZroPpu7wGLIGEN:Open-Set Grounded Text-to-Image Generation可控的文图生成官网:https://gligen.github.iodemo: https://huggingface.co/spaces/gligen/demo代码:https://github.com/gligen/GLIGENHigh-resolution image reconstruction with latent diffusion models from human brain activity论文:https://www.biorxiv.org/content/10.1101/2022.11.18.517004v2主页:https://sites.google.com/view/stablediffusion-with-brain报道:大脑视觉信号被Stable Diffusion复现图像!“人类的谋略和谎言不存在了”https://mp.weixin.qq.com/s/1wloJt03QdCTRBTe7qZSvAHuman Motion Diffusion as a Generative Prior人体运动扩散论文: arxiv.org/abs/2303.01418主页: priormdm.github.io/priorMDM-page/Interactive Text Generation交互式文本生成论文: https://arxiv.org/abs/2303.00908代码: https://github.com/ffaltings/InteractiveTextGenerationDirected Diffusion: Direct Control of Object Placement through Attention Guidance向扩散(Directed Diffusion)通过注意力引导实现了对物体位置的直接控制,简化文本到图像模型的图像编辑。论文: https://arxiv.org/abs/2302.13153Consistency ModelsOpenAI的一致性模型,主要是可以单步抽样,不需要对抗训练。思路和deep Q-learning 很类似。论文: https://arxiv.org/abs/2303.01469ChatGPT 之后,NLP 还有 12 个待解决命题https://mp.weixin.qq.com/s/yLFGywgB29mmjVRL7OEOtA课程:使用 Diffusers 实现 ControlNet 高速推理https://mp.weixin.qq.com/s/k8rE9GrF97E-0TKJhih9kw原链接:https://huggingface.co/blog/controlnet商业:三个基础假设https://mp.weixin.qq.com/s/jC-_B_arDpm1dsEmJLZYIwJasper狂飙:AIGC现象级应用的增长秘笈 https://mp.weixin.qq.com/s/skrrjxJg70rtPr2kxv7B7AControlNet star量破万!2023年,AI绘画杀疯了? https://mp.weixin.qq.com/s/lkR03NnKSF00q6W_Lc9D1wOpenAI推出新业务模式:售卖Model instance  https://mp.weixin.qq.com/s/NGXUls453rgEHu8yMNBR0Q案例:基于 ChatGPT API 的划词翻译 Chrome 插件https://github.com/yetone/openai-translator北大团队搞出ChatExcel,说人话自动处理表格 https://mp.weixin.qq.com/s/sSbvbJ2Zc3igj017OlybMAAI帮个忙https://ai-toolbox.codefuture.top

【Diffution】搭建ChilloutMix & LoRA模型推理环境

首先你需要了解几个概念:GPU:英伟达的显卡,2060起步,显存至少8G。主要用于模型的推理,你也可以用云服务的GPUChilloutMi......

AIGC周刊 | 第16期

时间: 2023.2.20-2023.2.26最新技术:Modulating Pretrained Diffusion Models fo......

AIGC周刊 | 第15期

时间: 2023.2.13-2023.2.19最新技术:Scaling Vision Transformers to 22 Billion......

AIGC周刊 | 第14期

时间: 2023.2.6-2023.2.12最新技术:Zero-shot Generation of Coherent Storybook......

【Diffution】01.扩散模型 101

扩散模型简介扩散模型是通过学习给定的训练样本,生成模型可以学会如何 生成 数据,比如生成图片或者声音。一个好的生成模型能生成一组 样式不同 ......

【游戏AI】02.6 种可以用于游戏开发的AIGC工具

AIGC工具可以在很多方面给游戏开发提供帮助,像原画,对话,动画,游戏剧情等等。使用正确的游戏AIGC工具,可以在很短的时间内完善基本的游戏元素,提高游戏开发效率。<......
查看专栏详情