AIGC探索之旅_link管理

link管理

链接快照平台

输入网页链接，自动生成快照
标签化管理网页链接

AIGC周刊 | 第18期

时间： 2023.3.5-2023.3.12本周大事记1. 微软公布视觉ChatGPT3月8号，微软公布了自己的Visual ChatGPT论文Visual ChatGPT: Talking, Drawing and Editing with Visual Foundation Models论文： https://arxiv.org/abs/2303.04671代码： https://github.com/microsoft/visual-chatgptdemo: https://huggingface.co/spaces/microsoft/visual_chatgpt有人把Visual ChatGPT这篇论文当一篇工程性的文章，不就是chatGPT和几个开源文生图模型的整合么？其实它可以是一个多模态的训练框架，提供了统一数据，统一架构，统一的解决流程。当然目前也有很多限制，期待后面的更新迭代吧。相关链接：视觉ChatGPT来了，微软发布，代码已开源https://mp.weixin.qq.com/s/w0jx7FKNw2y-LCY3OtlPJg中文支持版本https://github.com/wxj630/visual-chatgpt-zh2. Together发布OpenChatKit，一个开源ChatGPT的平替Together团队发布了ChatGPT的开源平替OpenChatKit，源代码、模型权重和训练数据集全部公开，由前OpenAI研究员共同打造。OpenChatKit一共包含200亿参数，在EleutherAI的GPT-NeoX-20B上进行了微调。介绍： https://www.together.xyz/blog/openchatkit代码：https://github.com/togethercomputer/OpenChatKitdemo：https://huggingface.co/spaces/togethercomputer/OpenChatKit模型： https://huggingface.co/togethercomputer/GPT-NeoXT-Chat-Base-20B相关链接：ChatGPT开源平替来了，开箱即用！前OpenAI团队打造，GitHub刚发布就揽获800+星https://mp.weixin.qq.com/s/-MEOhOVut2dCvbF5N6UfyQTogether Releases The First Open-Source ChatGPT Alternative Called OpenChatKithttps://www.marktechpost.com/2023/03/12/together-releases-the-first-open-source-chatgpt-alternative-called-openchatkit/最新技术：Tag2Text: Guiding Vision-Language Model via Image Tagging论文: arxiv.org/abs/2303.05657主页：tag2text.github.ioRewarding Chatbots for Real-World Engagement with Millions of Users论文: arxiv.org/abs/2303.06135模型: huggingface.co/ChaiMLRodin: A Generative Model for Sculpting 3D Digital Avatars Using Diffusion论文: https://arxiv.org/abs/2212.06135主页: https://3d-avatar-diffusion.microsoft.com/Open-world Instance Segmentation: Top-down Learning with Bottom-up Supervision主页： https://tarun005.github.io/UDOSA Comprehensive Survey of AI-Generated Content (AIGC)论文： https://arxiv.org/abs/2303.04226X-Avatar: Expressive Human Avatars论文：https://arxiv.org/abs/2303.04805ChatGPT for Training Data论文： arxiv.org/abs/2302.13007Speak Foreign Languages with Your Own Voice: Cross-Lingual Neural Codec Language Modeling论文: arxiv.org/abs/2303.03926主页: vallex-demo.github.ioUDAPDR: Unsupervised Domain Adaptation via LLM Prompting and Distillation of Rerankers论文：https://arxiv.org/pdf/2303.00807.pdfHiCLIP: Contrastive Language-Image Pretraining with Hierarchy-aware Attention论文: https://arxiv.org/abs/2303.02995Prismer: A Vision-Language Model with An Ensemble of Experts论文: https://arxiv.org/abs/2303.02506主页: https://shikun.io/projects/prismer代码: https://github.com/NVlabs/prismer课程：适配Diffusers框架的全套教程来了！从T2I-Adapter到大热ControlNet https://mp.weixin.qq.com/s/3cIr0KWrIE9TaVYV-6q4gQRunning LLaMA 7B and 13B on a 64GB M2 MacBook Pro with llama.cpp https://til.simonwillison.net/llms/llama-7b-m2商业：ChatGPT让亚马逊梦碎！微软CEO：Alexa、Siri、Cortana笨得和石头一样https://mp.weixin.qq.com/s/D5qGJMEcGhc2wAXHWlY8yQ企业级 Azure OpenAI ChatGPT 服务发布（国际预览版） https://mp.weixin.qq.com/s/oNM3SvMVk2dYSJhaF_bUigGPT-4将于下周发布，微软德国CTO：将提供完全不同的可能性 https://mp.weixin.qq.com/s/UgUaYL7HBgSawmvxlcARdg案例：AI画图实例：如何用Stable Diffusion创作游戏场景https://mp.weixin.qq.com/s/JO-LQXcnpkderR9QDx9y1wtyping-mind: ChatGPT 的UIhttps://www.producthunt.com/posts/typing-mindControlNet仅靠一张照片完成“旧房改造” https://mp.weixin.qq.com/s/OK12c91LgpyDUgdePP5Q9wAI再出王炸工具！一键实现CG制作全流程？https://mp.weixin.qq.com/s/S4exT1ySqJ5Wq-GlOibCxgCharacter.AI：个性化的ChatGPT，AI大模型时代的UGC平台 https://mp.weixin.qq.com/s/U4R8loz1G9PYM_l6IvNF_AAI角色直播https://www.twitch.tv/atheneaiheroesOpenGPThttps://open-gpt.app/d-di出品的，虚拟人视频聊天https://chat.d-id.comChatGPT版佛祖爆火出圈：施主，说出你的烦恼https://mp.weixin.qq.com/s/xk-AnFOQeJtnJsSMaJcDdQ

【论文解读】03. Visual ChatGPT：视觉ChatGPT

Visual ChatGPT标题： Visual ChatGPT: Talking, Drawing and Editing......

【游戏AI】03. 游戏资源生成平台scenario.gg

作为scenario.gg的最开始的内测用户，我来说说scenario.gg。scenario.gg 是一个游戏资源生成的平台，创始人叫Emm，目前已经拿到种子轮投资......

AIGC周刊 | 第17期

时间： 2023.2.27-2023.3.5本周大事记1. OpenAI ChatGPT API正式公布3月2日，ChatGPT API 正式公布，价格只有GPT3.5的十分之一。相关链接：https://openai.com/blog/introducing-chatgpt-and-whisper-apis2. 网友帮meta开源LLaMa2月24日，meta发布LLaMA（Large Language Model Meta AI），宣称开源，但是需要去填表申请，拿到回复邮件的时间并不确定。最近有网友帮忙，把已经拿到的模型发布在各大平台上并做成了测试demo，真正的帮meta开源。LLaMa模型，我也已经下载并传到了百度网盘，想下载的朋友可以在下面链接上找到。https://web.okjike.com/originalPost/6404b70d1f1113c2b7551feb相关链接：报道：Meta版ChatGPT惨遭“开源”？最新大模型LLaMA被泄露，已在GitHub收获7k+星https://mp.weixin.qq.com/s/L-7ggPv8Kb-PcFlhV78B9QMeta开源的ChatGPT平替到底好不好用？测试结果、加料改装方法已出炉，2天5.2k星https://mp.weixin.qq.com/s/kImwfWWtXMmEDVOhJZ4dJgGithub链接：https://github.com/facebookresearch/llama/pull/73/fileshuggingface上的模型下载：https://huggingface.co/ricecake/LLaMAllama-int8项目：https://github.com/tloen/llama-int8LLaMA-7B demo：https://huggingface.co/spaces/chansung/LLaMA-7BOpen source implementation for LLaMA-based ChatGPT training process https://github.com/nebuly-ai/nebullvm/tree/main/apps/accelerate/chatllama最新技术：Language Is Not All You Need: Aligning Perception with Language Models论文：https://arxiv.org/abs/2302.14045报道：微软多模态ChatGPT来了？16亿参数搞定看图答题、智商测验等任务https://mp.weixin.qq.com/s/aWqF25SwGTAtG5ZroPpu7wGLIGEN：Open-Set Grounded Text-to-Image Generation可控的文图生成官网：https://gligen.github.iodemo: https://huggingface.co/spaces/gligen/demo代码：https://github.com/gligen/GLIGENHigh-resolution image reconstruction with latent diffusion models from human brain activity论文：https://www.biorxiv.org/content/10.1101/2022.11.18.517004v2主页：https://sites.google.com/view/stablediffusion-with-brain报道：大脑视觉信号被Stable Diffusion复现图像！“人类的谋略和谎言不存在了”https://mp.weixin.qq.com/s/1wloJt03QdCTRBTe7qZSvAHuman Motion Diffusion as a Generative Prior人体运动扩散论文: arxiv.org/abs/2303.01418主页: priormdm.github.io/priorMDM-page/Interactive Text Generation交互式文本生成论文: https://arxiv.org/abs/2303.00908代码： https://github.com/ffaltings/InteractiveTextGenerationDirected Diffusion: Direct Control of Object Placement through Attention Guidance向扩散(Directed Diffusion)通过注意力引导实现了对物体位置的直接控制，简化文本到图像模型的图像编辑。论文： https://arxiv.org/abs/2302.13153Consistency ModelsOpenAI的一致性模型，主要是可以单步抽样，不需要对抗训练。思路和deep Q-learning 很类似。论文： https://arxiv.org/abs/2303.01469ChatGPT 之后，NLP 还有 12 个待解决命题https://mp.weixin.qq.com/s/yLFGywgB29mmjVRL7OEOtA课程：使用 Diffusers 实现 ControlNet 高速推理https://mp.weixin.qq.com/s/k8rE9GrF97E-0TKJhih9kw原链接：https://huggingface.co/blog/controlnet商业：三个基础假设https://mp.weixin.qq.com/s/jC-_B_arDpm1dsEmJLZYIwJasper狂飙：AIGC现象级应用的增长秘笈 https://mp.weixin.qq.com/s/skrrjxJg70rtPr2kxv7B7AControlNet star量破万！2023年，AI绘画杀疯了？ https://mp.weixin.qq.com/s/lkR03NnKSF00q6W_Lc9D1wOpenAI推出新业务模式：售卖Model instance https://mp.weixin.qq.com/s/NGXUls453rgEHu8yMNBR0Q案例：基于 ChatGPT API 的划词翻译 Chrome 插件https://github.com/yetone/openai-translator北大团队搞出ChatExcel，说人话自动处理表格 https://mp.weixin.qq.com/s/sSbvbJ2Zc3igj017OlybMAAI帮个忙https://ai-toolbox.codefuture.top

【Diffution】搭建ChilloutMix & LoRA模型推理环境

首先你需要了解几个概念：GPU：英伟达的显卡，2060起步，显存至少8G。主要用于模型的推理，你也可以用云服务的GPUChilloutMi......

AIGC周刊 | 第16期

时间： 2023.2.20-2023.2.26最新技术：Modulating Pretrained Diffusion Models fo......

AIGC周刊 | 第15期

时间： 2023.2.13-2023.2.19最新技术：Scaling Vision Transformers to 22 Billion......

AIGC周刊 | 第14期

时间： 2023.2.6-2023.2.12最新技术：Zero-shot Generation of Coherent Storybook......

【Diffution】01.扩散模型 101

扩散模型简介扩散模型是通过学习给定的训练样本，生成模型可以学会如何生成数据，比如生成图片或者声音。一个好的生成模型能生成一组样式不同 ......

【游戏AI】02.6 种可以用于游戏开发的AIGC工具

AIGC工具可以在很多方面给游戏开发提供帮助，像原画，对话，动画，游戏剧情等等。使用正确的游戏AIGC工具，可以在很短的时间内完善基本的游戏元素，提高游戏开发效率。<......
查看专栏详情