Wewnątrz HBF: Jak High Bandwidth Flash firmy SanDisk ładuje LLM bezpośrednio na sprzęt
Kluczowe wnioski
- High Bandwidth Flash (HBF) to nowa warstwa pamięci opracowana wspólnie przez SanDisk i SK hynix, zaprojektowana tak, aby wypełnić lukę między pamięcią HBM a tradycyjnymi dyskami SSD i rozwiązać problem "bariery pojemności pamięci" w AI.
- HBF oferuje przepustowość porównywalną z HBM, zapewniając jednocześnie 8-16 razy większą pojemność przy podobnym koszcie, co pozwala akceleratorom AI przechowywać znacznie więcej parametrów modelu i danych kontekstowych bezpośrednio dostępnych dla układu.
- Technologia została oficjalnie zaprezentowana 25 lutego 2026 r. podczas wspólnego wydarzenia w Milpitas w Kalifornii, wraz z globalnymi działaniami na rzecz standaryzacji w ramach Open Compute Project.
- HBF bazuje na istniejącej technologii BiCS NAND i CBA (CMOS Bonded Array) firmy SanDisk, a pierwsza generacja jest już w fazie prób, podczas gdy plany dla Gen 2 i Gen 3 zakładają przepustowość odczytu odpowiednio powyżej 2 TB/s i 3,2 TB/s.
- Próbki dla klientów mają pojawić się w 2026 roku, a pierwsze urządzenia AI z obsługą HBF spodziewane są już w 2027 roku, co czyni tę technologię perspektywiczną, choć jeszcze niedostępną komercyjnie.
- Analitycy często wskazują HBF jako jeden z strukturalnych powodów ogromnego wzrostu akcji SanDisk w 2026 roku, ponieważ może ona otworzyć wieloletni rynek pamięci do inferencji AI, o który rywalizują także NVIDIA i inni dostawcy.
Jeśli śledzisz niezwykły wzrost akcji SanDisk w 2026 roku i ciągle napotykasz termin HBF jako jego przyczynę, ten artykuł wyjaśnia, czym dokładnie jest High Bandwidth Flash, jak działa technicznie, dlaczego jest ważny dla inferencji dużych modeli językowych oraz na jakim etapie rozwoju znajduje się ta technologia. W skrócie, HBF to nowa architektura pamięci łącząca wysoką gęstość pamięci NAND flash z wydajnością przepustowości zbliżoną do HBM, czyli ultra-szybkiej pamięci używanej obecnie w akceleratorach AI firm NVIDIA i AMD. Celem jest umożliwienie układom AI przechowywania większej liczby wag modelu i danych kontekstowych blisko procesora, co redukuje powolne i kosztowne operacje na zewnętrznej pamięci masowej, powodujące "opóźnienia" podczas inferencji największych modeli językowych. SanDisk i SK hynix ogłosiły HBF i wysiłki standaryzacyjne w 2025 roku, przyspieszając wdrożenie oficjalną premierą w lutym 2026 roku. Choć inżynieria leżąca u podstaw tego rozwiązania jest nowatorska i zyskała uznanie w branży, należy odróżnić obecny status technologii (próbki, prototypy, wczesne plany) od spekulacji na temat produktów, które jeszcze nie istnieją.
Jeśli śledzisz, jak przełomy takie jak HBF zmieniają infrastrukturę AI i chcesz działać w oparciu o te badania z dostępem do danych rynkowych na żywo, możesz założyć darmowe konto przez WEEX pod adresem https://www.weex.com/pl/register?vipCode=vrmi i odkryć dostępne narzędzia handlowe.
Czym jest High Bandwidth Flash (HBF) w prostych słowach
Aby zrozumieć HBF, warto najpierw poznać problem hierarchii pamięci, który ma rozwiązać. Akceleratory AI, takie jak GPU, polegają na warstwowym systemie pamięci: ultra-szybka, ale droga i ograniczona pojemnościowo pamięć HBM znajduje się najbliżej układu, podczas gdy wolniejsza, ale znacznie większa i tańsza pamięć SSD znajduje się dalej. Wraz z rozwojem dużych modeli językowych, a zwłaszcza wzrostem okien kontekstowych do milionów tokenów, ilość danych, które modele muszą trzymać "blisko" procesora podczas inferencji, gwałtownie wzrosła. Gdy dane nie mieszczą się w HBM, systemy muszą je przeliczać ponownie (co jest wolne i kosztowne) lub pobierać z wolniejszych warstw pamięci, co tworzy wąskie gardła i opóźnienia zauważalne w aplikacjach AI przy dużym obciążeniu.
HBF zaprojektowano jako nową warstwę między tymi dwoma ekstremami. Zbudowany w oparciu o istniejącą technologię BiCS 3D NAND flash firmy SanDisk, a nie DRAM używany w HBM, HBF ma zapewniać przepustowość w podobnym zakresie co HBM, oferując jednocześnie od 8 do 16 razy większą pojemność przy porównywalnym koszcie. W efekcie pozwala to układowi przechowywać znacznie więcej parametrów modelu i danych podręcznych (key-value cache) fizycznie blisko, rozwiązując problem nazywany przez inżynierów "barierą pojemności pamięci AI", czyli moment, w którym modele stają się ograniczone nie przez moc obliczeniową, lecz przez ilość dostępnych danych.
| Warstwa pamięci | Baza technologiczna | Względna przepustowość | Względna pojemność | Typowa rola |
|---|---|---|---|---|
| HBM (High Bandwidth Memory) | DRAM | Najwyższa | Najniższa z trzech | Aktywne wagi modelu, obliczenia w czasie rzeczywistym |
| HBF (High Bandwidth Flash) | NAND flash (BiCS/CBA) | Porównywalna do HBM (cel) | 8-16x pojemność HBM | Kontekst inferencji, duże zbiory parametrów |
| Tradycyjny SSD | NAND flash | Najniższa | Najwyższa | Magazynowanie danych, dane zimne |
Dlaczego HBF jest ważny dla ładowania LLM bezpośrednio na sprzęt
Fraza "ładowanie LLM bezpośrednio na sprzęt" dobrze oddaje główną obietnicę HBF. Ponieważ HBF może pomieścić znacznie większą ilość danych, zapewniając przy tym przepustowość zbliżoną do HBM, możliwe staje się utrzymanie znacznie większej liczby parametrów modelu lub rosnącej pamięci podręcznej klucz-wartość podczas inferencji długiego kontekstu w szybkiej pamięci, zamiast ciągłego przesyłania danych z odległych magazynów. Według badań architektonicznych odnoszących się do stosu HBF firmy SanDisk, pojedyncza konfiguracja HBF zapewniająca 512 GB pamięci na parametry przy przepustowości około 1,2 TB/s mogłaby wspierać inferencję w czasie rzeczywistym dużych modeli typu mixture-of-experts i modeli rozumujących przy znaczących prędkościach generowania tokenów – profil, który badacze porównują do wydajności klastrów GPU klasy rack, ale w znacznie bardziej kompaktowej formie.
Jest to istotne, ponieważ obecne wąskie gardło w inferencji modeli typu transformer nie dotyczy głównie surowych obliczeń, lecz czasu, jaki system spędza na pobieraniu danych z pamięci, zamiast na wykonywaniu obliczeń. Jak wyjaśnił jeden z doradców technologii, profesor KAIST zaangażowany w oryginalny rozwój HBM, obciążenia inferencyjne w modelach transformer spędzają więcej czasu na przesyłaniu danych niż na obliczeniach. HBF bezpośrednio atakuje to wąskie gardło, zwiększając przepustowość znacznie większej i tańszej puli pamięci.
Harmonogram HBF: Od ogłoszenia do standaryzacji
Rozwój HBF przeszedł przez kilka konkretnych, weryfikowalnych kamieni milowych, zamiast pozostać czysto koncepcyjnym, co jest powodem, dla którego jest traktowany poważnie zarówno przez branżę półprzewodników, jak i analityków giełdowych.
| Data | Kamień milowy |
|---|---|
| 2025 (połowa roku) | SanDisk prezentuje koncepcję HBF na spotkaniu inwestorskim; zdobywa nagrody Best of Show i Most Innovative Technology na Flash Memory Summit 2025 |
| 6 sierpnia 2025 | SanDisk i SK hynix podpisują protokół ustaleń w sprawie wspólnej standaryzacji specyfikacji HBF |
| Koniec 2025 | Utworzenie rady doradczej technicznej; zespoły inżynierskie ds. projektowania NAND, ASIC i pakowania kontynuują wieloletni rozwój |
| 25 lutego 2026 | SanDisk i SK hynix organizują wspólne wydarzenie w Milpitas w Kalifornii, oficjalnie prezentując HBF i uruchamiając strumień prac nad globalną standaryzacją w ramach Open Compute Project |
| II połowa 2026 | Docelowe udostępnienie modułów próbnych wybranym klientom |
| Początek 2027 | Pierwsze produkty sprzętowe AI z integracją HBF, zgodnie z raportami branżowymi |
Ten harmonogram pokazuje, że HBF znajduje się obecnie w fazie prób i standaryzacji, a nie jest jeszcze wysyłany w komercyjnym sprzęcie AI. To rozróżnienie jest ważne dla każdego, kto ocenia nagłówki sugerujące, że technologia już dziś "eliminuje opóźnienia" w systemach produkcyjnych; w połowie 2026 roku HBF pozostaje technologią z bliskiego planu rozwoju, wspieraną przez działające prototypy i poważne partnerstwa branżowe, a nie szeroko wdrożonym produktem.
Plan techniczny HBF: Generacje wydajności
SanDisk opublikował perspektywiczne cele wydajnościowe dla wielu generacji HBF, zbudowanych na fundamencie CMOS Bonded Array (CBA) NAND.
| Generacja | Docelowa przepustowość odczytu | Docelowa pojemność stosu | Efektywność energetyczna vs Gen 1 |
|---|---|---|---|
| Gen 1 | Początkowa przepustowość fazy prób | Początkowa warstwa pojemności | Baza |
| Gen 2 | Powyżej 2 TB/s | Do 1 TB | ~0,8x zużycia energii |
| Gen 3 | Powyżej 3,2 TB/s | Do 1,5 TB | ~0,64x zużycia energii |
SanDisk przedstawia ten plan jako jedną ze swoich najbardziej skalowalnych platform półprzewodnikowych, argumentując, że w przeciwieństwie do DRAM, który napotyka rosnące wyzwania związane ze skalowaniem fizycznym, HBF korzysta z bardziej korzystnej ścieżki skalowania gęstości NAND poprzez architekturę BiCS firmy SanDisk. To, czy te cele generacyjne zostaną osiągnięte zgodnie z harmonogramem, będzie jednym z wyraźniejszych sygnałów technicznych, które analitycy będą obserwować w ciągu najbliższych dwóch do trzech lat.
Jak HBF wypada w porównaniu z konkurencyjnym podejściem NVIDIA
SanDisk i SK hynix nie są jedynymi graczami zajmującymi się barierą pojemności pamięci AI. NVIDIA, jako dominujący nabywca HBM, realizuje własną odpowiedź poprzez platformę Inference Context Memory Storage Platform (ICMSP), która wykorzystuje dyski NVMe SSD połączone z DPU, konkretnie powiązane z jednostką przetwarzania danych BlueField-4 firmy NVIDIA, aby przechowywać przepełnione dane pamięci podręcznej klucz-wartość z HBM i pamięci DRAM serwerów GPU. To podejście łączy się z procesorami GPU w platformie Vera Rubin firmy NVIDIA za pośrednictwem szybkiej sieci Ethernet wykorzystującej fotonikę, działającej z prędkością 800 Gb/s na port.
| Podejście | Firmy | Główna metoda | Status |
|---|---|---|---|
| HBF (High Bandwidth Flash) | SanDisk, SK hynix | Pakiet pamięci oparty na NAND naśladujący profil przepustowości HBM | Próby 2026, standaryzacja w toku |
| ICMSP | NVIDIA | Dyski NVMe SSD połączone z DPU przez szybki Ethernet | Zintegrowane z platformą Vera Rubin firmy NVIDIA |
| PBSSD | Samsung | Warstwa pamięci AI wspierana przez flash | W fazie rozwoju |
Warto zauważyć, że NVIDIA nie wyraziła publicznie bezpośredniego zainteresowania przyjęciem HBF, rozwijając zamiast tego własne rozwiązanie sieciowe warstwy pamięci masowej. Jest to ważne dla inwestorów i technologów, ponieważ sygnalizuje co najmniej dwie konkurencyjne filozofie architektoniczne rozwiązywania tego samego problemu: jedna (HBF) integruje flash bezpośrednio w pakiecie przypominającym pamięć blisko układu obliczeniowego, podczas gdy druga (ICMSP) polega na szybkiej sieci do łączenia zewnętrznej pamięci flash z GPU. To, które podejście lub kombinacja podejść stanie się standardem branżowym, prawdopodobnie ukształtuje wzorce popytu na NAND w porównaniu z sieciami i sprzętem DPU w ciągu najbliższych kilku lat.
Dlaczego HBF jest powiązany z historią akcji SanDisk
HBF stał się jednym z powtarzających się wyjaśnień technicznych, na które powołują się analitycy, omawiając dramatyczne wyniki cen akcji SanDisk w 2026 roku. Logika łączy trzy rzeczy: obciążenia inferencyjne AI są coraz bardziej ograniczone pojemnością pamięci, a nie tylko mocą obliczeniową; HBF bezpośrednio atakuje to ograniczenie rozwiązaniem opartym na NAND, które wykorzystuje główną siłę produkcyjną SanDisk; a istniejący biznes NAND firmy SanDisk już korzysta z oddzielnego, bardziej bezpośredniego cyklu popytu na dyski SSD dla przedsiębiorstw napędzanego przez AI. Razem tworzą one narrację, w której SanDisk nie tylko korzysta z krótkoterminowego cyklu cen NAND, ale może być również ustawiony w centrum długoterminowej zmiany architektonicznej w sposobie budowania sprzętu AI, zakładając, że HBF osiągnie szeroką adopcję w branży.
Warto jasno spojrzeć na różnicę między tymi dwiema historiami. Wzrost akcji SanDisk do połowy 2026 roku był napędzany głównie przez obecny popyt na dyski SSD dla przedsiębiorstw i ceny kontraktowe NAND, co jest realnym i już monetyzującym się trendem. HBF natomiast jest przyszłą szansą na przychody, wciąż w fazie prób i standaryzacji, z integracją sprzętu komercyjnego spodziewaną najwcześniej około 2027 roku. Niektórzy analitycy rynkowi przewidują znaczące przyspieszenie popytu związanego z HBF dopiero około 2030 roku, w miarę jak obciążenia inferencyjne AI będą się dalej skalować w całej branży. Inwestorzy i traderzy powinni traktować HBF jako długoterminowy czynnik opcjonalności nałożony na krótkoterminową, już sprawdzoną historię cen NAND firmy SanDisk, a nie jako obecny motor napędowy przychodów.
Ryzyka i otwarte pytania wokół HBF
Pozostaje kilka rzeczywistych niepewności, zanim HBF stanie się głównym elementem infrastruktury AI. Standaryzacja poprzez Open Compute Project wymaga czasu i szerokiego wsparcia branżowego wykraczającego poza SanDisk i SK hynix; bez szerszej adopcji ze strony producentów GPU i integratorów systemów, HBF ryzykuje pozostanie niszowym rozwiązaniem. Brak publicznego zaangażowania NVIDIA w HBF, biorąc pod uwagę jej dominującą pozycję w projektowaniu akceleratorów AI, jest znaczącym otwartym pytaniem, ponieważ jej własne podejście ICMSP reprezentuje konkurencyjną architekturę, która mogłaby przechwycić tę samą szansę rynkową inną ścieżką techniczną. Złożoność produkcji również nie jest trywialna; HBF łączy zaawansowane układanie 3D NAND, nowatorskie pakowanie i techniki łączenia płytek, które muszą niezawodnie skalować się do produkcji wielkoseryjnej – proces, nad którym zespoły inżynierskie pracowały podobno od prawie dwóch lat, jeszcze przed publicznym ujawnieniem. Wreszcie, jak w przypadku każdej wschodzącej technologii półprzewodnikowej, rzeczywista wydajność, uzysk i dane kosztowe osiągnięte w masowej produkcji mogą różnić się od celów generacyjnych opublikowanych przez SanDisk.
Przemyślenia końcowe
HBF reprezentuje nowatorskie podejście do jednego z najbardziej palących wąskich gardeł technicznych infrastruktury AI: jak utrzymać wystarczającą ilość istotnych danych wystarczająco blisko procesora, aby uniknąć opóźnień wynikających z dzisiejszych limitów pojemności pamięci. Łącząc wysoką gęstość pamięci NAND flash z wydajnością przepustowości zbliżoną do HBM, SanDisk i SK hynix celują w problem, który staje się coraz bardziej pilny w miarę skalowania modeli językowych w stronę coraz dłuższych okien kontekstowych i bardziej złożonych obciążeń rozumujących. Technologia przeszła od koncepcji do działającego prototypu i formalnego wspólnego startu z realnym impetem standaryzacyjnym w niecałe dwa lata, co jest szybkim tempem jak na standardy branży półprzewodników. Mimo to, HBF pozostaje przedkomercyjny w połowie 2026 roku, z próbkami dla klientów planowanymi na koniec tego roku i pierwszym zintegrowanym sprzętem AI spodziewanym dopiero w 2027 roku. Dla każdego, kto ocenia szerszą historię pamięci masowej AI firmy SanDisk, HBF najlepiej rozumieć jako wiarygodny, dobrze zasobny długoterminowy zakład nałożony na już sprawdzony, obecnie monetyzujący się biznes NAND i SSD dla przedsiębiorstw.
Jeśli tego rodzaju dogłębna analiza technologii napędzającej akcje infrastruktury AI jest dla Ciebie przydatna, możesz przekuć te badania w działanie, rejestrując się przez WEEX pod adresem https://www.weex.com/pl/register?vipCode=vrmi i odkrywając platformę handlową.
Często zadawane pytania
1. Czym jest High Bandwidth Flash (HBF) i czym różni się od HBM?
HBF to nowa technologia pamięci zbudowana na bazie NAND flash, a nie DRAM, zaprojektowana w celu zapewnienia przepustowości porównywalnej z High Bandwidth Memory (HBM), oferując jednocześnie od 8 do 16 razy większą pojemność pamięci przy podobnym koszcie. HBM pozostaje szybszy i ma niższe opóźnienia, ale HBF pozwala systemom AI przechowywać znacznie więcej danych, takich jak parametry modelu lub kontekst inferencji, dostępnych bez kosztów i limitów pojemności czystej pamięci opartej na DRAM.
2. Kiedy HBF będzie dostępny w rzeczywistych produktach sprzętowych AI?
W połowie 2026 roku HBF znajduje się w fazie prób i standaryzacji. Moduły próbne mają zostać udostępnione wybranym klientom w drugiej połowie 2026 roku, a pierwsze produkty sprzętowe AI z integracją HBF spodziewane są od początku 2027 roku, zgodnie z raportami branżowymi.
3. Czy HBF zastępuje HBM w układach AI, takich jak GPU NVIDIA?
Nie. HBF został zaprojektowany, aby uzupełniać HBM, a nie go zastępować. Ma działać jako dodatkowa warstwa pamięci, która znajduje się między ultra-szybkim HBM a tradycyjną, znacznie wolniejszą pamięcią masową SSD, obsługując dane o dużej pojemności, takie jak kontekst inferencji, które nie wymagają absolutnie najwyższej prędkości HBM, ale nadal potrzebują znacznie lepszej wydajności niż standardowa pamięć masowa.
4. Które firmy rozwijają technologię HBF?
SanDisk i SK hynix wspólnie rozwijają HBF i podpisały protokół ustaleń w sierpniu 2025 roku w celu standaryzacji jego specyfikacji. Oficjalnie wprowadzili technologię na wspólnym wydarzeniu w lutym 2026 roku i współpracują z Open Compute Project nad standaryzacją w całej branży, podczas gdy konkurenci tacy jak NVIDIA i Samsung realizują własne alternatywne podejścia do tego samego wąskiego gardła pamięci.
5. Jak HBF jest powiązany ze wzrostem ceny akcji SanDisk w 2026 roku?
Analitycy wskazują HBF jako długoterminowy, perspektywiczny czynnik wzrostu nałożony na bardziej bezpośrednią historię cen SSD dla przedsiębiorstw i NAND firmy SanDisk, która była głównym krótkoterminowym czynnikiem stojącym za wzrostem akcji. HBF reprezentuje przyszłą opcjonalność powiązaną z potencjalnym nowym rynkiem architektury pamięci AI, a nie obecne źródło przychodów, ponieważ produkty komercyjne nie są spodziewane przed 2027 rokiem.
Zastrzeżenie
Ten artykuł służy wyłącznie celom informacyjnym i edukacyjnym i nie stanowi porady finansowej, inwestycyjnej, prawnej ani technicznej. Informacje o technologii HBF, harmonogramach produktów i oświadczeniach firm odzwierciedlają publicznie dostępne dane na połowę 2026 roku i mogą ulec zmianie w miarę rozwoju technologii; dostępność komercyjna, specyfikacje wydajności i harmonogramy adopcji mogą istotnie różnić się od obecnych planów. Odniesienia do wyników akcji SanDisk mają charakter ilustracyjny i nie stanowią rekomendacji kupna lub sprzedaży jakichkolwiek papierów wartościowych. Zawsze przeprowadzaj własne niezależne badania i skonsultuj się z licencjonowanym doradcą finansowym przed podjęciem jakichkolwiek decyzji inwestycyjnych. Ani autor, ani wydawca nie ponoszą odpowiedzialności za jakiekolwiek straty wynikające z polegania na tej treści.



