Linearizing Large Language Models Arxiv Papers podcast

Artwork

Science Igor Melnyk

Indhold leveret af Igor Melnyk. Alt podcastindhold inklusive episoder, grafik og podcastbeskrivelser uploades og leveres direkte af Igor Melnyk eller deres podcastplatformspartner. Hvis du mener, at nogen bruger dit ophavsretligt beskyttede værk uden din tilladelse, kan du følge processen beskrevet her https://da.player.fm/legal.

Arxiv Papers « »
Linearizing Large Language Models

27d ago 13:19

Del

MP3•Episode hjem

Indhold leveret af Igor Melnyk. Alt podcastindhold inklusive episoder, grafik og podcastbeskrivelser uploades og leveres direkte af Igor Melnyk eller deres podcastplatformspartner. Hvis du mener, at nogen bruger dit ophavsretligt beskyttede værk uden din tilladelse, kan du følge processen beskrevet her https://da.player.fm/legal.

Linear transformers offer a subquadratic-time alternative to softmax attention, but face scaling issues. SUPRA proposes uptraining existing large transformers into RNNs for cost-effective performance.

https://arxiv.org/abs//2405.06640

YouTube: https://www.youtube.com/@ArxivPapers

TikTok: https://www.tiktok.com/@arxiv_papers

Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016

Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers

--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support

… continue reading

1137 episoder

#Science #Igor Melnyk

Artwork

Linearizing Large Language Models

published 27d ago

Del

MP3•Episode hjem

Indhold leveret af Igor Melnyk. Alt podcastindhold inklusive episoder, grafik og podcastbeskrivelser uploades og leveres direkte af Igor Melnyk eller deres podcastplatformspartner. Hvis du mener, at nogen bruger dit ophavsretligt beskyttede værk uden din tilladelse, kan du følge processen beskrevet her https://da.player.fm/legal.

Linear transformers offer a subquadratic-time alternative to softmax attention, but face scaling issues. SUPRA proposes uptraining existing large transformers into RNNs for cost-effective performance.

https://arxiv.org/abs//2405.06640

YouTube: https://www.youtube.com/@ArxivPapers

TikTok: https://www.tiktok.com/@arxiv_papers

Apple Podcasts: https://podcasts.apple.com/us/podcast/arxiv-papers/id1692476016

Spotify: https://podcasters.spotify.com/pod/show/arxiv-papers

--- Support this podcast: https://podcasters.spotify.com/pod/show/arxiv-papers/support

… continue reading

1137 episoder

#Science #Igor Melnyk

Todos os episódios

×

Velkommen til Player FM!

Player FM is scanning the web for high-quality podcasts for you to enjoy right now. It's the best podcast app and works on Android, iPhone, and the web. Signup to sync subscriptions across devices.

Lyt til 500+ emner