自2022年11月ChatGPT正式上線開始,引發(fā)了新一輪全球人工智能熱潮。
GPT(Generative Pre-trained Transformer)是OpenAI公司開發(fā)的一種基于Transformer架構(gòu)的大型語言模型(Large Language Model)。
大語言模型作為ChatGPT的底層架構(gòu),是一種基于機器學習和自然語言處理技術(shù)的模型,通過對大量的文本數(shù)據(jù)進行訓練,來學習服務(wù)人類語言理解和生成的能力。簡單來說,大語言模型這個內(nèi)核在學習大量文本數(shù)據(jù)的同時還進行著相關(guān)的“訓練”,進而在一定程度上模擬出人類的語言認知生成過程。
大模型具有大量的參數(shù),并采用了復(fù)雜結(jié)構(gòu)的機器學習模型,可以處理大規(guī)模的數(shù)據(jù)和復(fù)雜的問題。相對而言,傳統(tǒng)的機器學習模型,如邏輯回歸、決策樹、樸素貝葉斯等,規(guī)模較小,只能處理少量的數(shù)據(jù)。深度學習模型則可以包含數(shù)百萬個參數(shù),處理海量數(shù)據(jù)。而超大規(guī)模深度學習模型甚至可以達到百億級別的參數(shù),需要使用超級計算機進行訓練。
目前很多科技公司和機構(gòu)發(fā)布了他們自己的大模型,如OpenAI發(fā)布ChatGPT-4、微軟發(fā)布必應(yīng)AI、Google發(fā)布Bad、百度發(fā)布 “文心一言”等。據(jù)不完全統(tǒng)計,目前國內(nèi)包括百度、阿里、華為在內(nèi)至少19家大型科技公司、科研院校和初創(chuàng)科技團隊涉足人工智能大模型訓練。
本文整理了國內(nèi)外常見的AI大模型,可以測試學習。
國 內(nèi)
發(fā)布機構(gòu) | 模型名稱 | 模型連接 |
訊飛 | 星火大模型 | https://xinghuo.xfyun.cn |
百度 | 文心一言 | https://yiyan.baidu.com |
阿里 | 通義千問 | https://tongyi.aliyun.com |
華為 | 盤古大模型 | https://pangu.huaweicloud.com |
清華 | 智譜清言 | https://yiyan.baidu.com |
復(fù)旦 | 大學MOSS | https://moss.fastnlp.top |
商湯 | 商量 | https://chat.sensetime.com |
360 | 智腦 | https://www.so.com/zt/invite.html |
抖音 | 云雀大模型 | https://www.doubao.com |
中科院 | 紫東太初 | https://xihe.mindspore.cn |
上海人工智能實驗室 | 書生通用 | https://intern-ai.org.cn |
網(wǎng)易 | 子曰大模型 | https://aicenter.youdao.com |
天工 | AI助手 | https://tiangong.kunlun.com |
國 際
發(fā)布機構(gòu) | 模型名稱 | 模型連接 |
OpenAI | ChatGPT | https://chat.openai.com |
微軟 | 必應(yīng)AI | https://www.bing.com/new |
Anthropic | Claude | https://www.anthropic.com |
Anthropic | Claude 2 | https://claude.ai/chats |
Bad | https://bard.google.com | |
Poe | AI聊天 | https://poe.com |
Character.AI | Character.AI | https://www.character.ai |
Neeva | Neeva | https://neeva.com |
聯(lián)系客服