Skip to main content

Digilasku osa 2


Keskustelimme asiakkaan kanssa, mitä mieltä he ovat Googlen pilvipalvelun käytöstä. Heillä ei ollut ongelmaa sielunsa myymisessä kansainväliselle yhtiölle. Asiakkaan tulevaisuudensuunnitelmiin ei kuulu oman hakukonepalvelun aloittamista, joten päätimme luottaa Googleen. Tietokanta on toki kryptattu, mutta kryptausavain on koodissa, joka on Googlen hallussa.

Käytimme tietokantaratkaisuna App Enginen omaa NoSQL tietokantaa. App Enginen datastore tarjoaa JDO standardoidun DataNucleus merkintöjä syövän ORM tallennustilan. Päädyimme ratkaisuun, koska se nopeuttaa tietokannan suunnittelua. Toisena perusteena on helppo datan integraatio Vaatimeen, koska pystymme käyttämään POJOja sekä tallennukseen, että itse applikaation komponenteissa.

Tietokannasta tuli melko "ei-relaatiomainen" ja lopulta aika huono. Suurta hämmennystä aluksi herätti App Enginen indeksointiquota. Kun testailimme aplikaatiota ensimmäisiä kertoja varsinaisella alustalla, ihmettelimme miksi indeksointioperaatiota tapahtuu, vaikka aplikaation ei pitäisi tehdä minkäänlaisia tietokantaoperaatioita.

Syyksi paljastui ehkä suurin haittapuoli App Enginessä Vaadin alustana. Vaadin tallentaa istuntodataa tietokantaan. Tässä on muutama haittapuoli. Vaadin tallentaa istuntodatan yhtenä entitynä, jonka maksimikoko on 1MB App Enginessä. Jokainen uusi luku ja tallennusoperaatio vie myös indeksointioperaatioquotaa, jonka huomasimme kuluvan nopeimmin. Myös App Engine itsessään tallentaa istuntodataa, kylläkin pienemmissä osissa, mutta aiheuttaa sitäkin enemmän indeksointioperaatioita.

Vaadin onneksi osaa hyödyntää memcachea istuntodatan tallennuksessa, mikä vähentää ainakin lukuoperaatioita. Ongelmana on kuitenkin istunnon koon kasvaminen, lähinnä PDF ikkunoiden takia. Tilapäisenä ratkaisuna zippaan istuntodatan ennen tallennusta. Tämä kutisti istuntodatan koon jopa yhdeksäsosaan alkuperäisestä.

Istuntodataa alkaa aikaa myöten kertyä jonkun verran. Putsaaminen on helppo suorittaa cronilla, joka kutsuu Vaatimen servletin /CLEAN urlia, joka poistaa sekä App Enginen että Vaatimen istuntodatan. Tässä voi hyödyntää backendiä, jonka suoritusaikaquota on erillinen frontend suoritusajasta.

App Engine tarjoaa kohtuullisen monipuolisen hallintapaneelin, josta näkee statistiikkaa erilasista rajoituksista, tietokannasta ja logit. Loggaus onnistuu Javan omalla JRE-kirjastolla, ja logitilaa on 1GB. Hallintapaneelista pääsee tarkastelemaan instansseja ja säätää näille maksimimäärän tai minimimäärän, tosin vain jos laskutus on päällä.

Comments

Popular posts from this blog

I'm not a passionate developer

A family friend of mine is an airlane pilot. A dream job for most, right? As a child, I certainly thought so. Now that I can have grown-up talks with him, I have discovered a more accurate description of his profession. He says that the truth about the job is that it is boring. To me, that is not that surprising. Airplanes are cool and all, but when you are in the middle of the Atlantic sitting next to the colleague you have been talking to past five years, how stimulating can that be? When he says the job is boring, it is not a bad kind of boring. It is a very specific boring. The "boring" you would want as a passenger. Uneventful.  Yet, he loves his job. According to him, an experienced pilot is most pleased when each and every tiny thing in the flight plan - goes according to plan. Passengers in the cabin of an expert pilot sit in the comfort of not even noticing who is flying. As someone employed in a field where being boring is not exactly in high demand, this sounds pro...

PydanticAI + evals + LiteLLM pipeline

I gave a tech talk at a Python meetup titled "Overengineering an LLM pipeline". It's based on my experiences of building production-grade stuff with LLMs I'm not sure how overengineered it actually turned out. Experimental would be a better term as it is using PydanticAI graphs library, which is in its very early stages as of writing this, although arguably already better than some of the pipeline libraries. Anyway, here is a link to it. It is a CLI poker app where you play one hand against an LLM. The LLM (theoretically) gets better with a self-correcting mechanism based on the evaluation score from another LLM. It uses the annotated past games as an additional context to potentially improve its decision-making. https://github.com/juho-y/archipylago-poker

"You are a friendly breadwinner"

A recent blog post by Pete Koomen about how we still lack truly "AI-native" software got me thinking about the kinds of applications I’d like to see. As the blog post says, AI should handle the boring stuff and leave the interesting parts for me. I listed down a few tasks I've dealt with recently and wrote some system prompts for potential agentic AIs: Check that the GDPR subprocessor list is up to date. Also, ensure we have a signed data processing agreement in place with the necessary vendors. Write a summary of what you did and highlight any oddities or potentially outdated vendors. Review our product’s public-facing API. Ensure the domain objects are named consistently. Here's a link to our documentation describing the domain. Conduct a SOC 2 audit of our system and write a report with your findings. Send the report to Slack. Once you get approval, start implementing the necessary changes. These could include HR-related updates, changes to cloud infras...