BEEspoke Data

community

https://www.bees.org/

AI & ML interests

'an LLM is only as good as the dataset it was trained on' - Sun Tzu

Organization Card

Community About org cards

🐝📊💁

Collections 7

spaces 1

pinned

Sleeping

🐝

BeeCoder Demo

models 48

BEE-spoke-data/tFINE-900m-e16-d32-flan-infinity-instruct-7m-T2T_en-1024-infinity-instruct-7m-T2T_en-1024-v2

Text2Text Generation • Updated about 3 hours ago

datasets 60

BEE-spoke-data/smollm-corpus-python

Viewer • Updated 23 days ago • 12.4M • 149

BEE-spoke-data/flan-v2-hf

Viewer • Updated Jul 28 • 819M • 9

BEE-spoke-data/the-stack-smol-xs-all

Viewer • Updated Jul 27 • 8.7k • 4

BEE-spoke-data/the-stack-smol-xs-scored-and-annotated-python

Viewer • Updated Jul 20 • 100 • 2

BEE-spoke-data/upvoteweb-posts

Viewer • Updated Jul 13 • 45.9M • 8

BEE-spoke-data/napierone-pdf-raw

Viewer • Updated Jun 30 • 18.5k • 5

BEE-spoke-data/fineweb-1000_64k

Viewer • Updated Jun 23 • 2k • 15 • 2

BEE-spoke-data/govdocs1-image

Viewer • Updated Jun 23 • 199k • 12

BEE-spoke-data/sarcasm-scrolls

Viewer • Updated Jun 23 • 8.76k • 2 • 1

BEE-spoke-data/fineweb-edu-10BT-mincols

Viewer • Updated Jun 7 • 9.67M • 4 • 1

BEEspoke Data

AI & ML interests

Collections 7

BEE-spoke-data/smol_llama-101M-GQA

BEE-spoke-data/smol_llama-81M-tied

BEE-spoke-data/smol_llama-220M-GQA

BEE-spoke-data/verysmol_llama-v11-KIx2

BEE-spoke-data/smol_llama-220M-openhermes

BEE-spoke-data/smol_llama-220M-open_instruct

BEE-spoke-data/beecoder-220M-python

BEE-spoke-data/zephyr-220m-sft-full

spaces 1

BeeCoder Demo

models 48

BEE-spoke-data/tFINE-900m-e16-d32-flan-infinity-instruct-7m-T2T_en-1024-infinity-instruct-7m-T2T_en-1024-v2

BEE-spoke-data/tFINE-900m-e16-d32-instruct

BEE-spoke-data/tFINE-900m-e16-d32-flan

BEE-spoke-data/slimpajama_tok-48128-BPE-forT5

BEE-spoke-data/claude-tokenizer-forT5

BEE-spoke-data/Meta-Llama-3-8Bee

BEE-spoke-data/MiniTokenizer-20480

BEE-spoke-data/BeeTokenizer

BEE-spoke-data/smol_llama-220M-GQA-fineweb_edu

BEE-spoke-data/Mistral-7B-v0.3-stepbasin-books-20k

datasets 60

BEE-spoke-data/smollm-corpus-python

BEE-spoke-data/flan-v2-hf

BEE-spoke-data/the-stack-smol-xs-all

BEE-spoke-data/the-stack-smol-xs-scored-and-annotated-python

BEE-spoke-data/upvoteweb-posts

BEE-spoke-data/napierone-pdf-raw

BEE-spoke-data/fineweb-1000_64k

BEE-spoke-data/govdocs1-image

BEE-spoke-data/sarcasm-scrolls

BEE-spoke-data/fineweb-edu-10BT-mincols

AI & ML interests

Team members 7

Collections 7

spaces 1

BeeCoder Demo

models 48 Sort: Recently updated

datasets 60 Sort: Recently updated

models 48

datasets 60