Skip to main content

Digilasku osa 2


Keskustelimme asiakkaan kanssa, mitä mieltä he ovat Googlen pilvipalvelun käytöstä. Heillä ei ollut ongelmaa sielunsa myymisessä kansainväliselle yhtiölle. Asiakkaan tulevaisuudensuunnitelmiin ei kuulu oman hakukonepalvelun aloittamista, joten päätimme luottaa Googleen. Tietokanta on toki kryptattu, mutta kryptausavain on koodissa, joka on Googlen hallussa.

Käytimme tietokantaratkaisuna App Enginen omaa NoSQL tietokantaa. App Enginen datastore tarjoaa JDO standardoidun DataNucleus merkintöjä syövän ORM tallennustilan. Päädyimme ratkaisuun, koska se nopeuttaa tietokannan suunnittelua. Toisena perusteena on helppo datan integraatio Vaatimeen, koska pystymme käyttämään POJOja sekä tallennukseen, että itse applikaation komponenteissa.

Tietokannasta tuli melko "ei-relaatiomainen" ja lopulta aika huono. Suurta hämmennystä aluksi herätti App Enginen indeksointiquota. Kun testailimme aplikaatiota ensimmäisiä kertoja varsinaisella alustalla, ihmettelimme miksi indeksointioperaatiota tapahtuu, vaikka aplikaation ei pitäisi tehdä minkäänlaisia tietokantaoperaatioita.

Syyksi paljastui ehkä suurin haittapuoli App Enginessä Vaadin alustana. Vaadin tallentaa istuntodataa tietokantaan. Tässä on muutama haittapuoli. Vaadin tallentaa istuntodatan yhtenä entitynä, jonka maksimikoko on 1MB App Enginessä. Jokainen uusi luku ja tallennusoperaatio vie myös indeksointioperaatioquotaa, jonka huomasimme kuluvan nopeimmin. Myös App Engine itsessään tallentaa istuntodataa, kylläkin pienemmissä osissa, mutta aiheuttaa sitäkin enemmän indeksointioperaatioita.

Vaadin onneksi osaa hyödyntää memcachea istuntodatan tallennuksessa, mikä vähentää ainakin lukuoperaatioita. Ongelmana on kuitenkin istunnon koon kasvaminen, lähinnä PDF ikkunoiden takia. Tilapäisenä ratkaisuna zippaan istuntodatan ennen tallennusta. Tämä kutisti istuntodatan koon jopa yhdeksäsosaan alkuperäisestä.

Istuntodataa alkaa aikaa myöten kertyä jonkun verran. Putsaaminen on helppo suorittaa cronilla, joka kutsuu Vaatimen servletin /CLEAN urlia, joka poistaa sekä App Enginen että Vaatimen istuntodatan. Tässä voi hyödyntää backendiä, jonka suoritusaikaquota on erillinen frontend suoritusajasta.

App Engine tarjoaa kohtuullisen monipuolisen hallintapaneelin, josta näkee statistiikkaa erilasista rajoituksista, tietokannasta ja logit. Loggaus onnistuu Javan omalla JRE-kirjastolla, ja logitilaa on 1GB. Hallintapaneelista pääsee tarkastelemaan instansseja ja säätää näille maksimimäärän tai minimimäärän, tosin vain jos laskutus on päällä.

Comments

Popular posts from this blog

RocksDB data recovery

I recently needed to do some maintenance on a RocksDB key-value store. The task was simple enough, just delete some keys as the db served as a cache and did not contain any permanent data. I used the RocksDB cli administration tool ldb to erase the keys. After running a key scan with it, I got this error Failed: Corruption: Snappy not supported or corrupted Snappy compressed block contents So a damaged database. Fortunately, there's a tool to fix it, and after running it, I had access to the db via the admin tool. All the data was lost though. Adding and removing keys worked fine but all the old keys were gone. It turned out that the corrupted data was all the data there was. The recovery tool made a backup folder, and I recovered the data by taking the files from the backup folder and manually changing the CURRENT file to point to the old MANIFEST file which is apparently how RocksDB knows which sst (table) files to use. I could not access the data with the admin tool, ...

I'm not a passionate developer

A family friend of mine is an airlane pilot. A dream job for most, right? As a child, I certainly thought so. Now that I can have grown-up talks with him, I have discovered a more accurate description of his profession. He says that the truth about the job is that it is boring. To me, that is not that surprising. Airplanes are cool and all, but when you are in the middle of the Atlantic sitting next to the colleague you have been talking to past five years, how stimulating can that be? When he says the job is boring, it is not a bad kind of boring. It is a very specific boring. The "boring" you would want as a passenger. Uneventful.  Yet, he loves his job. According to him, an experienced pilot is most pleased when each and every tiny thing in the flight plan - goes according to plan. Passengers in the cabin of an expert pilot sit in the comfort of not even noticing who is flying. As someone employed in a field where being boring is not exactly in high demand, this sounds pro...

PydanticAI + evals + LiteLLM pipeline

I gave a tech talk at a Python meetup titled "Overengineering an LLM pipeline". It's based on my experiences of building production-grade stuff with LLMs I'm not sure how overengineered it actually turned out. Experimental would be a better term as it is using PydanticAI graphs library, which is in its very early stages as of writing this, although arguably already better than some of the pipeline libraries. Anyway, here is a link to it. It is a CLI poker app where you play one hand against an LLM. The LLM (theoretically) gets better with a self-correcting mechanism based on the evaluation score from another LLM. It uses the annotated past games as an additional context to potentially improve its decision-making. https://github.com/juho-y/archipylago-poker